2019 年 9 月 14 日 (土) に開催された第 63 回 日本薬学会 関東支部大会にて、招待講演をしてまいりました。タイトルは
生成モデルによるデータの可視化・回帰分析・クラス分類・モデルの適用範囲の設定・モデルの逆解析・分子設計・材料設計
です!講演は
シンポジウム S3 薬学分野における人工知能(AI)の活用
にて行われました。ご招待いただいた、北里大学の志鷹先生、西端先生どうもありがとうございました。
シンポジウムはこちらにもありますように、以下のとおりです。
シンポジウム S3薬学分野における人工知能(AI)の活用
オーガナイザー: 竹田-志鷹 真由子(北里大学 薬学部)
座長: 竹田-志鷹 真由子(北里大学 薬学部)、西端 芳彦(北里大学 薬学部)
S3-1 生成モデルによるデータの可視化・回帰分析・クラス分類・モデルの適用範囲の設定・モデルの逆解析・分子設計・材料設計
金子 弘昌(明治大学 理工学部)
S3-2 アカデミアにおける創薬AIの開発と活用の試み
河合 健太郎(摂南大学 薬学部)
S3-3 製薬企業における人工知能の活用そして期待
山﨑 広之(塩野義製薬(株))
S3-4 人工知能(AI)を活用した新規かかりつけ薬剤師支援システムに関する研究開発
亀井 淳三(星薬科大学)
シンポジウムの内容は、人工知能 (Artificial Intelligence, AI) で分子設計したり、薬剤師を支援したりです。企業の中でどのように AI が活用されているか示されたり、企業の中で AI の立ち位置がどのようになっているか説明があったりして面白かったです。ちなみに、わたしの要旨は下のような感じです。
生成モデルによるデータの可視化・回帰分析・クラス分類・モデルの適用範囲の設定・モデルの逆解析・分子設計・材料設計
○金子 弘昌
明治大学 理工学部
既存の実験データを活用して分子設計をすることを考える。対象とする活性・物性の値が測定された化合物データを収集し、化合物の化学構造を数値化して記述子で表現する。記述子データを低次元化、すなわち少ない数のパラメータに圧縮し、パラメータ間で化合物の散布図を見ることで、化合物群の全体の様子を可視化できる。記述子と活性・物性との間で回帰分析・クラス分類をすることで、記述子から活性・物性を推定するモデルを構築可能である。仮想的に生成させた化学構造を記述子に変換することで、その化学構造の化合物を合成する前に活性値・物性値を推定できるが、すべてのモデルにはモデルが本来の推定性能を発揮できる記述子の領域が存在するため、そのモデルの適用範囲を設定しなければならない。
分子設計、つまりモデルの逆解析をするまでに、データの可視化・回帰分析・クラス分類・モデルの適用範囲の設定をする必要がある。それぞれ別の手法が用いられていたため、それらをまたいだ議論はできず、データ解析が非効率であった。
本研究では、データの可視化・回帰分析・クラス分類・モデルの適用範囲の設定・モデルの逆解析を同時に行う生成モデルを構築する手法である Generative Topographic Mapping Regression (GTMR) を開発した [1,2]。GTMR は Generative Topographic Mapping (GTM) [3] に基づく手法であり、活性・物性と全記述子間の同時確率密度分布を正規分布の重ね合わせで表現できるため、式変形することで回帰分析 (クラス分類) にもモデルの逆解析にも応用できる。GTMR により目標の活性値・物性値となる記述子の値のセットが、モデルの適用範囲も考慮された上で得られるため、それを目指して分子設計を実行することが可能となる。GTM および GTMR の Python コードはこちら [4] で公開している。
参考文献
- Kaneko, Mol. Inf., 38, 1800088, 2019
- https://datachemeng.com/gtmmlr_gtmr_paper/
- https://datachemeng.com/generativetopographicmapping/
- https://github.com/hkaneko1985/gtm-generativetopographicmapping
発表したスライドの pdf ファイルはオンラインサロンで公開します。
興味がございましたらぜひご覧くださいませ。
懇親会では次につながる話もあり充実した大会参加でした。
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。