分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y = f(x) を構築し、構築したモデルに x の値を入力して y の値を予測したり、y が目標値となる x の値を設計したりします。
x の値の設計をするための一般的なモデルの逆解析では、まず x に上限・下限を決めて、その範囲内で乱数に基づいて x の候補を生成します。このとき、場合によっては x に制約を設定し、その制約を満たす候補のみ生成します。次に、生成した候補をすべてモデルに入力し、y の値を予測します。そして、 予測結果が良好な候補を選択します。ベイズ最適化では、y の予測値の代わりに、獲得関数の値が良好な候補を選択します。
ここで最初に決める上限・下限は、データ解析や機械学習では決まりません。実験系における装置の制約や材料の制約などによって、上限・下限を決めます。他にも、ドメイン知識を使い、たとえば合成可能な候補になるように制約を決めることもあります。
もし、上限・下限がないようなとき、実験系・シミュレーション系で決められないときには、かなり大きな値として上限・下限を設定するか、モデルの直接的逆解析が有効です。
モデルの直接的逆解析では、y を入力すると x に制約を設けることなく x の値が計算されます。もちろん、モデルの直接的逆解析において、あえて x に制約を設定することも可能です。
ぜひ、ご自身の実験系やシミュレーション系の範囲内で x の設計を実施していただければと思います。
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。