本日は明治大学の卒業式+学位記授与式です。データ化学工学研究室 (金子研) の3人の4年生も卒業します。一年間、早いものです。
3人とも修士に進学しますので、研究室内の状況としてはあまり変わらないのですが、一つの区切りですので、4年生の一年間の研究をまとめておきます。
3人それぞれの研究分野は
- 分子設計
- 材料設計
- プロセス管理 (ソフトセンサー)
とばらばらですが、共通しているのは
サンプルが少ない場合でも、うまくデータを解析して、良好なモデルを構築しよう!
ということです。
菅野君は、分子設計において、多数の化学構造データに着目しました。たとえば活性推定モデルを構築するとき、活性の測定された化合物のサンプル数は小さいかもしれませんが、活性の測定されていない化合物や仮想的な化学構造のデータは多いです。これらのデータをすべて活用して、推定精度の高い活性推定モデルを構築しよう、というものです。”すべて活用” といっても、使える化学構造もあれば使えない化学構造もありますので、うまく選択する必要があります。
ちなみに、”推定精度の高い” という中には、全体的な推定精度ももちろんですが、たとえば活性の値が大きいところの局所的な推定精度も含まれています。
清水君は、材料設計において、新しい記述子 (特徴量・説明変数・入力変数) を開発したり、その中から良好な物性推定モデルを構築できる記述子の組み合わせだけを選択したり、していました。この研究では、本当にサンプル数が小さいため、
実際、モデルの推定精度はどれくらいなのか?
について、確認することも難しいです。なので、新たな推定精度の指標の開発、についても研究に含まれています。
小島君は、ソフトセンサーを対象にして時系列データを扱い研究しています。このテーマでは、もちろんサンプル数が小さい場合もありますが、サンプル数が大きい場合もありますので、いろいろなケースに柔軟に対応できる手法を開発しました。具体的には、ソフトセンサーのもつ推定性能を見積もる方法です。時系列データの特徴を活かして、構築されたソフトセンサーが新しいデータに対してどの程度の精度で推定できるのか、計算することができるようになります。
ちなみに菅野君と清水君は、日本薬学会第138年会 (金沢) で 2018年3月28日に発表予定です。年会に参加されている方で、もし興味がありましたらよろしくお願いします。
小島君はテーマ的に薬学会向きではありませんので、来年度にまた別の学会で発表してもらいたいと考えています。
3人とも研究成果の内容で論文執筆予定ですので、研究内容の詳細についてはそちらでご確認いただければと思います。
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。