機械学習モデルの逆解析の整理〜線形・非線形モデル、xの制約あり・なし、線形計画法、直接的逆解析、化学構造など

分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y = f(x) を構築し、構築したモデルに x の値を入力して y の値を予測したり、y が目標値となる x の値を設計したりします。

y が目標値となる x もしくはそれに関連する化学構造などを設計することは、モデルの逆解析です。

回帰モデル・クラス分類モデルの逆解析～目標のY(物性・活性など)を達成するためのX(説明変数・記述子・特徴量・パラメータ・入力変数)とは？～

回帰モデルやクラス分類モデルが得られたあとの話です。よくやるのは、説明変数 (記述子・特徴量・パラメータ・入力変数) X の値を回帰モデルやクラス分類モデルに入力して、目的変数 Y の値を推定することです。これをモデルの順解析とよびます。そ...

[無料公開] 「Pythonで学ぶ実験計画法入門ベイズ最適化によるデータ解析」の “まえがき”、目次の詳細、第１・２章

2021 年 6 月 3 日に、金子弘昌著の「Pythonで学ぶ実験計画法入門ベイズ最適化によるデータ解析」が出版されました。講談社: Amazon: Amazon(Kindle): === 出版して約２年経過した 2023 年 4 月 ...

モデルには線形モデルや非線形モデルがあり、x に制約がない場合もあれば制約がある場合もあります。化学構造などから x への変換が必要になる場合も。。。

そこでここでは、モデルの逆解析について整理します。

まずは線形モデルについて考えます。例えば、以下のようなモデルがあったとします。

y = 5x₁ – 2x₂

y の値の目標値が、例えば 10 と定められた場合、これを満たす x₁ と x₂ の組み合わせを求めることが、モデルの逆解析の対象です。

x に制約がない場合は、(x₁, x₂) = (0, –5), (2, 0), (4, 15), ・・・などのように、無数に解析解が存在します。このように線形モデルで x に制約がない時に無数に解析解が得られることは、x の数が 3 以上になっても同様です。もちろん、x に制約がある場合は解が存在しないこともあります。モデルが線形であれば、制約がない場合も一般的な制約がある場合も、x の解が複数ではありますが線形計画法で x の解析解が得られます。

モデルが非線形モデルの時は、一般的には x の解析解を得ることができません。そのため、疑似的に逆解析を行うことになります。具体的には、まず x の候補を大量に生成します。x に制約がある場合は、その制約を満たした上で、候補を大量に生成します。その後、生成された x の候補を非線形モデルに入力して y の値を予測します。ベイズ最適化の場合には、予測値だけでなくその分散を用いて獲得関数を計算します。y の予測値が良好な値を持つ候補や獲得関数の値の大きい候補を選択することで、y の目標値から x の候補が得られます。このように、非線形モデルに対しては、x から y の予測である順解析を繰り返す、擬似的な逆解析になります。

一方で、直接的逆解析では、