2018年3月13, 14日で奈良先端科学技術大学院大学 (NAra Institute of Science and Technology, NAIST) において開催された異分野融合ワークショップ「データ科学との融合による化学の新展開」で、招待講演をさせていただいてきました。招待していただいたNAISTの畑中先生、どうもありがとうございます。
【学生リポーター】
昨日と今日の2日間、ワークショップ『データ科学との融合による化学の新展開』を開催しています。とても興味深い講演ばかりですので、ワクワクしています!(リポーター:醤油) pic.twitter.com/MDt1PQJoox— NAIST(日本語) (@NAIST_MAIN) 2018年3月14日
2日間の講演者と講演タイトルはこちらです (敬称略)。
3月13日(火)
作村諭一(NAIST)「膜電位時系列を用いた細胞内シグナル経路推定」
本郷研太(JAIST・JSTさきがけ)「第一原理計算の進展とインフォマティクスとの融合展開」
山西芳裕(九州大学・JSTさきがけ)「AI創薬:多様な疾患に対するデータ駆動型の新薬開発」
瀧川一学(北海道大学・JSTさきがけ)「分子のグラフ表現と機械学習」
吉田亮(統計数理研究所)「物質構造の表現・学習・生成・合成」
小林正人(北海道大学・JSTさきがけ)「反応経路探索とインフォマティクス:触媒・表面吸着系計算への応用」
畑中美穂(NAIST・JSTさきがけ)「反応経路自動探索:機械学習による高効率化を目指して」
3月14日(水)
小野直亮(NAIST)「グラフ畳み込みネットワークを用いたアルカロイド化合物の代謝パスウェイの分類」
金子弘昌(明治大学)「データ駆動型モデルの適用範囲を考慮して効率的に分子設計・材料設計する方法」
観山正道(東北大学)「スパースモデリングをもちいたSTMトポグラフィデータの解析」
小原真司(NIMS・JSTさきがけ)「実験・理論・先端数理学の融合によるガラス科学の進化と深化」
研究分野的に近い内容でしたので他の方々の研究の話もよくわかり、またディスカッションも先端的で、とても楽しい二日間でした。
さきがけ研究者も多く、基本的にまだまだ自分自身の手で研究している方々ばかりだったので、話もとてもおもしろく、刺激的でした。いくつか研究のアイデアも浮かんだので生かしていきたいです。
また企業からいらしていた方も多く、講演後はいろいろとお話させていただきました。共同研究など、今後の発展につながるとうれしいです。
懇親会でも、美味しい奈良の地酒を堪能させていただき、研究会・懇親会ともにホスピタリティーあふれる素敵なシンポジウムでした。畑中先生どうもありがとうございました。
ちなみに、わたしの講演における質疑応答はこんな感じでした。
===
質問1: 化学構造生成について、狙いの構造変化ができないとき、また構造変化の可能性としてが複数存在するときはどうするか?
回答1: 狙いの構造変化ができないときは仕方がありませんので、モデル構築用データを見直したり、モデルを見直したりします。構造変化の可能性として複数あるときは、それぞれ構造変化させてみて検討します。
===
質問2: 記述子の表現の違いで、物性との間で線形で表せたり非線形性が生じたりするのではないか?
回答2: おっしゃるとおりです。そのため、一連の解析で記述子を統一する必要があります。
===
質問3:モデルの適用範囲について、データ密度だけでなく、推定値の感度も大事ではないか?
回答3:データ密度が変化したときの感度は、coverage vs. RMSE の解析結果で考慮されています。モデルの感度については、検討できておりません。
===
質問4:推定性能について、coverageも考慮して検討するということか?
回答4: おっしゃる通りです。クロスバリデーション後のRMSEだけみても、たとえばRMSEが大きいときに over-fittingか under-fitting かわかりません。coverage vs. RMSE をみることで、coverage ごとの推定性能を検討できます。
===
質問5:ベイズ推定で推定値の標準偏差を計算したときと、データ密度でモデルの適用範囲を考えたときとで、どちらのほうが性能がよいか。
回答5: 2つの比較については検討できていません。
===
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。