分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y = f(x) を構築し、構築したモデルに x の値を入力して y の値を予測したり、y が目標値となる x の値を設計したりします。
y の値をモデルに入力して x の値を直接的に計算できる方法として、当研究室で開発したモデルの直接的逆解析があります。一般的なモデルの逆解析が、x の候補を大量に生成した後に、そのすべてをモデルに入力して y の値を予測したり、ベイズ最適化では獲得関数の値を計算したりして、その中で良好な x の候補を選択する擬似的な逆解析に対して、当研究室の直接的逆解析では、y の値 (目標値) をモデルに入力することで x の値を瞬時に計算できます。疑似的な逆解析では、x の候補を大量に生成しているとはいえ、x の候補をすべて生成することは不可能であり (すべての候補数は設計変数 (パラメータ) の数に対して指数関数的に増加します)、漏れが生じる一方、直接的逆解析では、そもそも x の候補を生成する必要がないため、y の目標値を達成するための x の値をそのまま計算できます。
さらに、スペクトルデータや時系列データなど、特徴量の間に強い関係があるときには、疑似的な逆解析は適用できません。例えば、スペクトルデータでは、波長もしくは波数が近いと、特徴量の値は似ていますので、x の候補もそれらの関係に基づいて生成する必要がありますが、単純に乱数で生成することはできません。もちろん、x のデータに基づいて、オートエンコーダーなどのモデルを学習させた後に、x の新たな候補を生成することはできますが、学習データに基づいて生成されるため、網羅性は担保されません (似たような候補ばかり生成されてしまう可能性があります)。直接的逆解析では、x 間の関係性を考慮した上で、y の目標値から x の候補を直接的に計算できます。これにより、スペクトルの形状らしさ、時系列データのプロファイルらしさを満たした上で、y の値から x の候補を計算できます。例えば時系列データであれば、提案された x の 時系列変化に基づいて運転・制御することで、y の目標値を達成できます。
このように、y の値からそれを達成するためのスペクトルデータや時系列データを生成できるため、モデルの解釈、そして実験系におけるメカニズムの解明をはじめとして、様々な分野に応用できると考えています。ぜひ、各自のアイデアと組み合わせ、直接的逆解析をご利用いただけますと幸いです。
以上です。
質問やコメントなどありましたら、X, facebook, メールなどでご連絡いただけるとうれしいです。