分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y = f(x) を構築し、構築したモデルに x の値を入力して y の値を予測したり、y が目標値となる x の値を設計したりします。
モデルの逆解析をする時、仮想的な x を大量に生成してそれらをモデルに入力し、y を予測し、予測値が良好な x の候補を選択したり、ベイズ最適化において獲得関数の値が大きい x の候補を選択したりします。

y の値から直接的に x を予測することもできます。


もちろん y が複数あることもあり、y の予測値を利用した方法でも、ベイズ最適化でも、直接的逆解析でも対応可能です。
x の仮想サンプルを生成する際、x や、x から何らかの関数で変換した値に制約がある場合もあります。原料をある量までしか使用できないとか、組成の合計を 1 にしなければならない時とか、装置的な制約があったり、実験系的にいくつかの変数の間で満たさなければならない制約があったりします。x を生成する前にそれらの制約条件を明示的に入れられる時には、制約を満たす形で x の候補を生成すれば OK です。
一方で、実験した結果に制約がある場合など、制約自体も x を入力する機械学習モデルから得られる状況もあります。この時、一つの方法としては、x から制約 z を予測する機械学習モデルを構築した後に、x から z を予測して z の値が制約の範囲内の候補のみ選択し、選択された候補で y の値を予測したり、獲得関数の値を計算したりします。もちろん z を予測する機械学習モデルにも予測誤差がありますので、その予測誤差に応じて制約を強めたり、逆に緩めたりすることもあります。
この方法では制約を満たす候補しか y の予測をしないことから、選ばれる候補に多様性がなくなり、限定的になってしまう危険があります。そのため、y と z の多目的で最適化することも検討します。もちろん y が複数あったり、z が複数あったりする時にも有効です。
例えば、大量に生成した x の候補から y および z の値を予測した後にそれらのパレート最適解を選択したり、多目的遺伝的アルゴリズム(NSGA-II)などの多目的最適化手法によって z と y を両立させる x を生成したりします。

直接的逆解析では、y と z のそれぞれの目標値を網羅的に生成して、それらすべてをモデルに入力し、x を予測します。
このような方法を取ることで、多様な x を生成することができ、制約条件および y の予測値、もしくは獲得関数を考慮した上で、次に実験する x を検討できます。
分子設計・材料設計・プロセス設計では、様々な制約の中で新たな設計をする必要があますので、制約を考慮する必要がある時のモデルの逆解析の参考になれば幸いです。
以上です。
質問やコメントなどありましたら、X, facebook, メールなどでご連絡いただけるとうれしいです。