反応収率予測のための赤外スペクトル記述子を開発しました![金子研論文]

金子研の研究成果の論文が Molecular Informatics に掲載されましたので、ご紹介します。タイトルは

 

Infrared Spectral Descriptors for Reaction Yield Prediction: Toward Redefining Experimental Spaces

 

です。これは社会人ドクターの遠藤雄也さんが取り組んだ研究の成果です。

化学反応、特に触媒反応における収率の予測は、化学合成プロセスの効率化や製品品質の向上において極めて重要です。しかし、反応の鍵となる配位子の性質を定量化してモデルに組み込む際、従来の一般的な分子記述子や密度汎関数理論(DFT)に基づく記述子では、配位子の立体的および電子的な微細な違いや、動的な環境変化を十分に捉えきれず、異なる反応系に対する汎用性に欠けるという課題がありました。

この課題を解決するため、本研究は分子の電子分布と立体障害や分子内相互作用などの三次元構造情報を同時に反映する赤外(IR)スペクトルに着目し、配位子の反応性をより正確に表現する新たな記述子を提案しています。具体的には、データの一貫性を保つためにDFT計算によって対象化合物の理論的なIRスペクトルを取得し、波数のデータ領域をK-means法でクラスタリングしました。そして、各クラスタ内から最大強度のピークを用いた強度ベース(IntIR)と、そのピークに対応する波数を用いた波数ベース(WaveIR)の2種類の記述子を生成して評価を行いました。

提案手法の有用性を検証するため、パラジウム触媒による直接アリール化反応と鈴木・宮浦カップリング反応という2つの小規模な実験データセットを用い、未知の配位子に対する予測性能をLeave-One-Group-Out(LOGO)交差検証によって厳密に評価しました。その結果、波数ベースのIR記述子は、従来の分子記述子や構造フィンガープリントと比較して、未知のデータに対して優れた予測精度と順位付け精度を示しました。特に、分子の骨格構造などの特徴を豊富に含む指紋領域(0–1700 cm⁻¹)に限定した波数ベースの記述子が、ノイズを抑えつつ高い予測精度と化学的解釈性をもたらすことが確認されました。一方で、強度ベースの記述子は計算条件や電子分布の変化に敏感であり、安定性に欠けるため予測性能が劣ることも判明しました。

さらに本研究では、予測モデルの絶対的な誤差(MAE)が大きくなった場合でも、条件の良し悪しを評価する順位付けの精度(スピアマンの順位相関係数)は必ずしも低下しないという重要な知見も得られました。これは、絶対的な収率予測に誤差があっても、優れた実験条件を優先的に探索するための指標として本手法が十分に実用的であることを意味しています。結論として、IRスペクトルに基づく波数ベースの記述子は、小規模なデータセットであっても高い汎用性を発揮し、予測モデルの精度向上と解釈性の付与を通じて、効果的な実験計画の支援や新たな反応空間の構築に大きく貢献するアプローチと言えます。

興味のある方は、ぜひ論文をご覧いただければと思います。どうぞよろしくお願いいたします。

 

以上です。

質問やコメントなどありましたら、X, facebook, メールなどでご連絡いただけるとうれしいです。

タイトルとURLをコピーしました