モデルの精度が低いときも、モデルの逆解析ってやるべき？

いろいろと共同研究やコンサルティングをしていますと

共同研究・コンサルティングの相談や技術相談をご検討の方は、こちらをご一読いただけますと幸いです

共同研究・コンサルティングや技術相談のご検討をいただき、感謝申し上げます。一度金子に会って相談したい、という方もいらっしゃると思います。とてもうれしいことです。ただ、とても多くの方から相談を受けていたり、その中で実際に共同研究・コンサルテ...

大学で一番多くの共同研究をしている研究室は金子研です！！しかし、、、

おかげさまで、いろいろな企業の方々と共同研究させていただいており、データ化学工学研究室 (金子研) では、明治大学の中で一番多くの共同研究が進行しております。研究の深さや幅が広がり、うれしいかぎりでございます。ありがとうございます。科研費の...

やはり多いのは、モデルの逆解析です。

回帰モデル・クラス分類モデルの逆解析～目標のY(物性・活性など)を達成するためのX(説明変数・記述子・特徴量・パラメータ・入力変数)とは？～

回帰モデルやクラス分類モデルが得られたあとの話です。よくやるのは、説明変数 (記述子・特徴量・パラメータ・入力変数) X の値を回帰モデルやクラス分類モデルに入力して、目的変数 Y の値を推定することです。これをモデルの順解析とよびます。そ...

データ解析・機械学習に関する手法・考え方・注意点のまとめ

データ解析に関するいろいろな手法を解説した記事や、データ解析をするときの考え方の記事をまとめました。興味のある内容がございましたら、ぜひリンクへ飛んでいただけたらと思います。pdfファイルやパワーポイント(pptx)ファイルは、自由にご利用...

新たな分子を設計したり、新たな材料を作るための実験レシピやプロセスを設計したり、装置を設計したりといった話です。

モデルの逆解析をするためには、もちろんモデルが必要です。データベースを用いて、説明変数 (設計変数・記述子) X と目的変数 Y との間で、たとえば回帰モデルを構築します。構築されたモデルに基づいて、新たな分子や、新たな材料を作るための実験レシピ・プロセス条件や、シミュレーション条件などを提案します。

モデルを構築するとき、もちろんモデルの推定性能は高い方がよいです。さらに、適応的実験計画法において、基本的にベイズ最適化をすることが多く、

ベイズ最適化で期待できること

材料の活性・物性・特性は、化学構造だけで変化するものではなく、材料の作り方、つまり実験条件や製造条件によっても変化します。例えば高分子設計において、単量体 (モノマー) の化学構造だけでなく、そのモノマーの種類・組成比や、反応温度や反応時間...

新たな候補を提案するときに、たとえば Y の目標を達成する確率は高いほうがよいです。

ただ、モデルの推定性能がように上がらなかったり、新たに提案された候補における Y の目標を達成する確率が小さくなってしったりすることもあります。このときに、モデルやモデルの逆解析を行った結果が、何の役にも立たないかというと、そうではないのです。

モデルの逆解析するとき、基本的には乱数で新しい化学構造や新しい実験レシピ・プロセスの候補を発生させます。

物性や活性の推定値が大きくなるように、メインの骨格と側鎖を遺伝的アルゴリズムで最適化して、新たな化学構造を生成するPythonプログラムを公開します

以前に、Structure Generator based on R-Group (SGRG) という化学構造を生成する Python プログラムを公開しました。メインの骨格を一つに設定して、その自由結合手に結合する側鎖を、フラグメントの候...

[Pythonコードあり] 特徴量ごとや特徴量間に制限があるときの、モデルの逆解析用のサンプル生成

回帰モデルやクラス分類モデルを構築した後の、モデルの逆解析の話です。上の既存のサンプルの分布に従うように、モデルの逆解析用のサンプルをたくさん生成する方法では、既存のサンプルのデータ分布を求めて、その分布に従うようにして新たなサンプルを...

[Pythonコードあり] 既存のサンプルの分布に従うように、モデルの逆解析用のサンプルをたくさん生成する方法

回帰モデルやクラス分類モデルを構築した後は、モデルの逆解析をします。説明変数 (特徴量・記述子など) X のサンプルをたくさん生成して、それらをモデルに入力することで、目的変数 (活性・物性など) Y の値を推定します。推定された値が、より...

これが、けっこう役に立ちます。

一つは過去の実験を総括するのに役立つケースあります。たとえば、乱数に基づいて生成した候補について Y の値を推定し、その推定値がよい候補とか悪い候補とかを実際に見て確認します。そうすると、よいときはこんな実験条件で、悪いときはこんな実験条件だったのか、といったように、頭の中で整理ができます。

もう一つは、新たな発想が出てきたり、インスピレーションが湧き上がるのに役立つケースがあります。これまで似たような実験条件で実験してたり、同じようなパターンで実験していたり、ある範囲内でのみ実験することが多かったりすると、それを逸脱できない状況があったりします。モデルの逆解析では、新たな候補は基本的に乱数に基づいて発生されますので、これまで考えていなかったような実験条件も出てきます。このような候補を実際に見ることで、こんな実験条件もありだね、とか、こんな実験条件で実験してみてもいいかもね、といった新たな発想につながります。

以上のように、モデルの逆解析そのものにメリットがありますので、モデルの推定精度がよくなかったから止めてしまったりとか、ベイズ最適化における Y の目標を達成する確率が低かったから提案するのを止めてしまったりとかはもったいないです。実際に、当事者や現場の方に見てもらうのが、とてもよいと思います。

以上です。

質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。