金子研の論文が Macromolecular Theory and Simulations に掲載されましたので、ご紹介します。タイトルは
です。これは修士卒の谷脇寛明さんが修士1,2年生のときに取り組んだ研究の成果であり、主に言語翻訳等で用いられる Sequence-to-Sequence (Seq2Seq) with attention を、高分子化合物を対象にした反応予測に応用した逆合成反応予測モデルと合成反応予測モデル(構造生成)に関する論文です。
高分子化合物は様々な製品の材料として活用されており、ポリマーを対象とする研究が盛んに行われています。例えばマテリアルズ・インフォマティクスにおけるポリマーを対象とした研究成果により、ポリマーの物性値を予測するモデルを用いてポリマーが有望な物性値をもつモノマー構造を設計できるようになりました。しかし、コンピュータ上で設計されたモノマー構造は仮想的な構造であるため実際に合成できるか不明です。モノマー構造から反応物を予測するモデル (逆合成反応予測モデル) を構築できれば、より実現可能な構造を提案できます。本研究では、高分子化合物に対応した逆合成予測モデルを構築し、コンピュータ上で設計されたモノマー構造のポリマーを重合するための反応物を予測することを1つ目の目的としました。
本研究では、言語翻訳に使われるモデル構築手法である Seq2Seq Attention を逆合成反応予測モデルに利用します。Seq2Seq Attentionを使った逆合成反応予測モデルでは、言語のように反応物や生成物の文字列を単語化(トークン化)する必要があります。そのため、より予測精度の高い逆合成反応予測モデルを構築するために、どのようにトークン化を行うかについても検討しました。
一方、ポリマーが有望な物性値を持つモノマー構造の設計は行われていますが、モノマー構造を設計するための構造生成手法は、ポリマー設計のための重合反応を考慮したモノマー構造を生成する手法ではありません。例えば Breaking of Retrosynthetically Interesting Chemical Substructures (BRICS) や Variational Autoencoder は、ポリマー設計のための重合反応を考慮した構造設計ではないため、重合が困難と思われる一般的な化学構造を生成することが多いです。
本研究で逆合成反応予測モデルを構築する際に用いる Seq2Seq Attention を使い構築される反応物からモノマー構造を予測する合成反応予測モデルによって生成されるモノマー構造は、ある反応物から重合できると予測されるポリマーのモノマー構造であるため、一般的な化学構造は多く生成されず重合反応を考慮した自由結合手を持つモノマー構造を提案することができると考えられます。そこでモノマー構造を生成することも目的の一つとして、Seq2Seq Attentionをモデル構築手法として用いて、反応物からモノマー構造を予測する合成反応予測モデルを構築し、合成反応予測モデルを活用することでポリマー設計のための重合反応を考慮したモノマー構造を生成できると考え、新たな構造生成手法の開発も行いました。
興味のある方は、ぜひ論文をご覧いただければと思います。どうぞよろしくお願いいたします。
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。