化合物における三次元の化学構造の扱い、構造最適化計算のメリット・デメリット

化合物データの解析をすることを考えます。化合物の化学構造や物性・活性・特性が大事になります。 化合物の物性・活性・特性や化学構造の扱いについてはこちらをご覧ください。

化学構造・分子・化合物の扱いに関する基本的なこと
データセットがあると、データセットの可視化・クラスタリング・クラス分類・回帰分析などができるようになったり、モデルの適用範囲を設定したり、実験計画法により実験候補を選択できます。こちらにいろいろな手法の説明があります。 ただ、どの手法を使う...

 

化合物において、その化学構造の特徴を数値化し、数値化したものと物性・活性・特性との間でモデルをつくります。化学構造を数値化するわけですが、”正しい” 化学構造を考える必要があります。言い換えると、化合物が物性や活性を発現するときに、実際の化学構造がどのような形になっているか、です。

分子は、わたしたちの存在する三次元空間に存在していますので、基本的に分子は三次元の化学構造をもっていることが多いです。化学構造を数値化する前に、三次元の化学構造をコンピュータで的確に再現する必要があります。大事なことは、その分子が物性や活性を発現するときの分子の三次元構造でないと、意味がないということです。分子の正しい三次元構造を再現することが目的になります。

一つできることは第一原理計算・量子化学計算で構造最適化計算をすることでます。これにより (基本的には真空中で) 安定に存在すると考えられる分子の三次元構造を求めることができます。金子研でも、分子に対してそのような構造最適化計算により三次元構造を獲得してから、その構造の特徴を数値化して検討する研究をしています (詳しくは金子研オンラインサロンでの資料をご覧ください)。ただ、仮に最安定化構造が得られたとしても、その三次元構造が実際の三次元構造と同じかどうか、考える必要があります。第一原理計算・量子化学計算では、基本的に真空中を仮定して構造最適化計算が行われますが、対象としている物性・活性を発現するときの分子が真空中にあるとは限りません。もちろん、溶媒効果を考慮した構造最適化計算もできますが、たとえば創薬の分野では、分子とタンパクとの相互作用が大事になり、そのような分子の周辺の環境を考慮して構造最適化計算することは難しいです。

数値化する前の (最適化した) 分子の三次元構造が、実際の三次元構造と違うと、三次元構造から数値化したときにその違いが数値における誤差になります。それがノイズになり、特徴量 (分子記述子) と物性・活性との間で構築する回帰モデル・クラス分類モデルに悪影響を及ぼす可能性があります。どんな化合物、どんな物性・活性を解析するときでも分子に対して構造最適化計算をすればよい、とは限らないようです。

できることにより目的を達成できるか、よく考える必要があります。

今できることではなく、(はじめはできなくても)目的達成のためにやるべきことを、やろう!
まずは、たとえ話です。 東京にいる人が、沖縄に行きたいとき、できることとしては、沖縄の方向に歩きだすことです。でも、徒歩で沖縄に行くことは、不可能です (できるとしても非現実的な時間がかかります)。沖縄に行きたいときにはじめにすることは、羽...

 

実際、金子研で三次元構造の検討をするときには、必ず二次元構造での解析結果と比較しています。たとえば SMILES で表された化学構造を用いて分子記述子を計算し、物性・活性との間でモデルを構築し、モデルの推定性能を基準にしているわけです。

2019 年度は主に配座異性体 (conformer) に着目して、三次元構造でのモデリングを検討しています。詳細は 2020年1月28日(火) の金子研オンラインサロンメンバー限定のデータ化学工学研究室 (金子研究室) 成果報告会での発表をお聴きください。

 

以上です。

質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。

タイトルとURLをコピーしました