分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y = f(x) を構築し、構築したモデルに x の値を入力して y の値を予測したり、y が目標値となる x の値を設計したりします。
ここでは、所望の物性や活性をもつ材料を合成するための、種々の装置やそれらの組み合わせにおけるプロセス条件をモデルの逆解析により求めることを対象とします。実際に材料が合成される時のプロセス条件 x と、その結果として合成された材料の物性や活性 y との間でモデル y = f(x) を構築し、そのモデルを逆解析することで物性・活性の目標値を持つ材料を合成するプロセス条件を設計します。
モデルの逆解析をする時には、基本的に x とするのはプロセス条件のみです。もちろん装置によっては成り行きで変化する変数の値を測定・分析していることもありますが、それを x に入れた時にモデル逆解析をすると、成り行きで変わる変数の値も一緒に設計されてしまうことになり、それを次の実験・製造で実現することは困難です。そのため、装置の設定などで、再現できる形で直接操作可能なプロセス条件のみを x とします。
ただ、モデルを構築する際は比較としてプロセス条件に加えて成り行きで変化する変数も x に入れて構築されたモデルと、モデルの予測精度を比較すると良いでしょう。実験や製造の再現性を考えると、プロセス条件の候補セットが1つ定まれば、その結果合成され分析された後に得られる y の値は、(実験誤差を無視すれば) 基本的に一つに決まります。そのため、x と y の関係をデータセットから適切にモデル化できれば、x に成り行きで変わる変数を入れないモデルも入れたモデルも、基本的に予測精度は同じになります。
ここで、成り行きで変わる変数を x に入れた時にモデルの予測精度が向上する場合は、プロセス条件としての x が不足している場合があります。また、装置で設定できるわけではありませんが、実験・製造前に把握することのできる装置周りの環境に関するパラメータも x に入れて考慮すると良いでしょう。例えば、実験室における気温、圧力、湿度などです。これらは次の実験で自由に設定することができないかもしれませんが、モデルの逆解析をする際の固定値として使用できます。例えば環境の変数をある値に固定しておいて、それ以外のプロセス条件をランダムに振って仮想サンプルを生成し、それらの y の値を予測します。
プロセス条件をランダムに振る際、装置によってはプロセス条件や、いくつかのプロセス条件の間に制約があることもありますので、制約がある場合は制約に従うように x の仮想サンプルを生成するようにしましょう。また、装置の制約ではなく、モデルを構築するデータセットを見た時に x の間に関係がある場合もあり、モデルの適用範囲を考えた時にはその関係に従うように仮想サンプルを生成する方が良いこともあります。例えば、いくつかの温度を設定する際に、既存のデータセットにおいて2つの温度は必ず同じ値になっている時には、モデルの逆解析に用いる仮想サンプルを生成する際も、それら2つの温度は同じにする必要があります。なお、その2つの温度を振りたい場合には、実験計画法で検討する必要があります。
x として時系列データを考慮する場合には、時系列であることを考慮した上で仮想サンプルを生成したり、
モデルの直接的逆解析をする必要があります。
プロセスを対象にしたモデルの逆解析をする際には、以上の点に注意して実施するようにしましょう。
以上です。
質問やコメントなどありましたら、X, facebook, メールなどでご連絡いただけるとうれしいです。