金子研の研究成果の論文が The Journal of Organic Chemistry に掲載されましたので、ご紹介します。タイトルは
です。これは社会人ドクターの角居雄太さんが取り組んだ研究の成果です。
CoMFA(Comparative Molecular Field Analysis)は触媒設計において強力なツールですが、従来のPLS(部分的最小二乗法)回帰を用いたモデルでは、記述子(グリッド点)間の多重共線性により、回帰係数の解釈が困難でした。特に複数の潜在変数を用いる場合、個々の空間位置が不斉収率に与える独立した寄与を特定することが難しく、予測精度と解釈性の間にトレードオフが生じていました。
本研究では、予測精度を維持しつつ、有機化学者が直感的に理解できる信頼性の高いメカニズム的洞察を提供することを目指し、以下の手法を組み合わせた新しい解析フローを開発しました。
- PLS (n=1) モデリング: 潜在変数をあえて「1」に制限することで、多重共線性の影響を集約し、立体障害と不斉収率の相関を安定的かつ直接的に反映した回帰係数を得ることを意図しています。
- ベイズ最適化: CoMFAのグリッドパラメータ(空間サイズや間隔)と変数選択(ステップワイズ法)を最適化し、高い予測性能を持つモデルを探索しました。
- 寄与マップのマージ(Merging): 複数の最適化モデルから得られた寄与マップを平均化し、個別のモデルの局所的なばらつきやノイズを低減しました。
- 空間的集約(Aggregation): マージされたマップに対し、空間クラスタリングおよびスムージングとピーク抽出を行うことで、化学的に重要なホットスポット(主要な寄与領域)を特定しました。
データセットと評価パラジウム(Pd)触媒によるβ-ケトエステルの不斉フッ素化反応(30サンプル:5種類の触媒×6種類の基質)を対象にモデルを構築しました。モデルの予測性能は、交差検証係数(q2)や外部データに対する決定係数(R2)に加え、Golbraikh–Tropsha基準を用いて評価されました。
変数選択を行ったPLS (n=1) モデルは、最高で R2 = 0.94 という比較的高い予測精度を達成しました。また、集約された空間パターンと分子構造の重なりから算出された係数の和は、実験的な反応障壁(ΔΔG‡)と高い相関(ピアソン相関係数 0.8-0.9)を示しました。
解析の結果、触媒のBINAP骨格上のリン原子に結合するアリール(Ar)基周辺に、不斉収率向上に寄与する正のホットスポットが特定されました。これは、Ar基のメタ位置換基が立体的に重要であるという既存の化学的知見と一致しており、本手法の妥当性が示されました。
手法は、予測性能と解釈性の両立を実現し、複雑な不斉触媒反応系において、化学者が触媒構造のどの部分を修飾すべきかという明確な指針を与える強力なツールとなることが示されました。
興味のある方は、ぜひ論文をご覧いただければと思います。どうぞよろしくお願いいたします。
以上です。
質問やコメントなどありましたら、X, facebook, メールなどでご連絡いただけるとうれしいです。
