分子設計・材料設計・プロセス設計において分子記述子・合成条件・製造条件・プロセス条件などの特徴量 x と物性・活性・特性などの目的変数 y との間で数理モデル y = f(x) を構築し、そのモデルを活用して y の目標値を達成するための x の値の設計、すなわちモデルの解析を行います。一般的には x の値の候補を大量にモデル入力して y の値を予測し、予測値が良好な x の値を選択します。ベイズ最適化では、y の予測値の代わりに獲得関数の値を使います。
一方で、Gaussian Mixture Regression (GMR) や Generative Topographic Mapping Regression (GTMR) などで構築されたモデルを用いれば、y の目標値をモデルに入力して直接的に x の値を予測できます。いわゆる直接的逆解析です。
ただ、例えば x が離散値しかもたない場合、直接的逆解析では連続値としてしか出力されないため、直接的逆解析の結果をそのまま利用することができません。他にも x の制約条件があるときに有効な手法として、遺伝的アルゴリズム (Genetic Algorithm, GA) を用いた方法が開発されました。
これにより、x が制約条件を満たす中で、y の目標値を達成する確率が最も高いと考えられる x の値を獲得できます。詳細は上の文献をご覧ください。
この方法では GA を使用しているため、乱数のシードを固定しない限り、計算するごとに結果が変わります。そのため、例えば複数回実行して、それぞれ結果を保存しておき、それらの結果の中で GA の適合度 (今回は確率密度関数の値が最も高くなる結果) を選択するとよいです。また、複数回実行することで、GA でたまたま局所最適解に陥ってしまうような結果を避けられます。
なお GA を複数回実行して、得られた結果を総合的に用いることは、GA と他の手法を組合せた場合でも活用できます。
ご参考になれば幸いです。
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。