DFT計算を用いて複数の記述子セットを準備しておくことでベイズ最適化の探索性能の向上に成功しました![金子研論文]

金子研の論文が ACS Omega に掲載されましたので、ご紹介します。タイトルは

 

Enhancing the Search Performance of Bayesian Optimization by Creating Different Descriptor Datasets Using Density Functional Theory

 

です。これは 2023 年 9 月現在、社会人ドクターの森下敏治さんが取り組んだ研究の成果です。

化合物を対象にしたベイズ最適化をするとき、

[無料公開] 「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」 の “まえがき”、目次の詳細、第1・2章
2021 年 6 月 3 日に、金子弘昌著の「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」が出版されました。 講談社: Amazon: Amazon(Kindle): === 出版して約2年経過した 2023 年 4 月...

 

化合物の化学構造から計算された分子記述子を説明変数xとして主に使用します。一般的な化合物であれば、各種データベースから化学構造が得られ、分子記述子を計算できますが、例えば医薬品中間体や原薬のような秘密性が高い化合物は、データベースから検索・取得することはできません。また、特に量子化学計算や密度汎関数理論 (Density Functional Theory, DFT) に基づく計算で安定構造や電子状態を求める必要があるとき、記述子を計算するには多大な計算時間がかかります。もちろん、計算負荷が比較的軽いDFT計算により記述子を計算することもできますが、実験前に最良な基底関数や汎関数を選択することは難しく、一般的な組み合わせが慣習的に選択されることが多いです。

これまで、ベイズ最適化の探索性能に対する基底関数や汎関数の影響については議論されてきませんでした。選択された基底関数や汎関数で良好な探索性能が得られるかは、適用するデータセット次第です。

そこでこの論文では、基底関数・汎関数の様々な組合せで計算された記述子を活用して、ベイズ最適化の探索性能を向上する方法を開発しました。複数の記述子セットを平均化して作成した記述子をベイズ最適化に用いることで、単一の記述子セットを用いる場合よりも探索性能が向上します。また、平均化に用いる記述子セットが多くなるほど、ベイズ最適化の探索性能が向上することを確認しました。提案手法は計算負荷が比較的小さく、DFTに精通していない人でも簡単に利用可能な方法です。

興味のある方は、ぜひ論文をご覧いただければと思います。どうぞよろしくお願いいたします。

 

以上です。

質問やコメントなどありましたら、twitter、 facebook、 メールなどでご連絡いただけるとうれしいです。

タイトルとURLをコピーしました