三次元化学構造を考慮した分子記述子を開発しました![金子研論文]

金子研の論文が Industrial & Engineering Chemistry Research に掲載されましたので、ご紹介します。タイトルは

 

Development of New Molecular Descriptors Based on Flare Software Considering Three-Dimensional Chemical Structures

 

です。これは修士卒の中山祐生さんが修士のときに取り組んだ研究の成果であり、分子設計ソフトウェアの Flare から得られる情報に基づいて三次元化学構造を考慮した分子記述子を開発した論文です。

(追記) 表紙絵に選出されました!

医薬品開発や農薬開発において、創薬プロセスを加速するために機械学習が注目されています。定量的構造活性相関(Quantitative Structure-Activity. Relationship, QSAR)やクラス分類モデルを用いて、それぞれ活性値や活性有無が予測されています。分子の三次元構造を考慮した手法の一つに Comparative Molecular Field Analysis (CoMFA) があります。CoMFA は分子の電気特性や立体特性について重要な構造の情報が可視化されるため、結果を解釈しやすい手法です。しかし、CoMFA は共通構造を基準に分子を配置するため、解析に使用する全ての化合物に共通する構造が必要です。

本研究では、データセット内の化合物が共通構造を持たなくても活用することができる三次元化学構造の特性を考慮した記述子を開発し、クラス分類モデルの予測精度の向上を目的とした。本研究では、リガンドベースおよび構造ベースの分子設計ソフトウェアである Flare によって得られる正電荷、負電荷、表面、疎水性の情報とクラスタリング手法である k-means++、混合ガウスモデルを組み合わせて、分子の三次元構造の特性を考慮した3次元分子記述子を開発しました。提案する記述子では母骨格が異なっていても化合物の重ね合わせを行うことが可能であり、共通構造を有する必要がありません。さらに、どのクラスターの情報が重要かを確認することで電気特性や立体特性、疎水性における重要な構造の情報を取得することが可能であり解釈性が高いといえます。

除草剤のデータセット、アンジオテンシン変換酵素阻害活性剤のデータセット、環境毒性データセット、水溶解度データセットを用いて、提案した記述子の有効性および解釈性を検証しました。

興味のある方は、ぜひ論文をご覧いただければと思います。

 

以上です。

質問やコメントなどありましたら、X, facebook, メールなどでご連絡いただけるとうれしいです。

タイトルとURLをコピーしました