分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y = f(x) を構築し、構築したモデルに x の値を入力して y の値を予測したり、y が目標値となる x の値を設計したりします。
ソフトセンサーにおいて、モデルの劣化に対応するため、適応型ソフトセンサーが用いられています。
Moving Window (MW) 型の適応型ソフトセンサーでも、Just-In-Time (JIT) 型の適応型ソフトセンサーでも、モデル構築を継続的に繰り返します。モデルを構築するときには、y とは関係のない x がデータセットにあるとノイズになってしまうため、予測精度の高いモデルを構築するためには、y にとって重要な x のみでモデルを構築することが重要です。重要な x を考えるときに忘れてはいけないのは、y に対する時間遅れです。ある時刻の y と x が関連している場合だけでなく、プロセスのダイナミクスのため、ある時刻の y に対して少し前の時刻における x が関係していることがあります。そのため、x を選択するときには、その x の時間遅れも同時に考慮する必要があります。x の選択と時間遅れの幅の選択を同時にできる手法が Genetic Algorithm-based process Variable and Dynamics Selection (GAVDS) です。
GAVDS により、y にとって重要な x とその y に対する時間遅れの幅を同時に最適化できます。
基本的に変数選択はモデル構築の前に実施するものです。適応型ソフトセンサーではモデル構築を継続的に繰り返すため、そのモデル構築ごとに変数選択をすることになってしまいます。ただ、ソフトセンサーとしてオンラインでリアルタイムに予測することを考えると、毎回 x とその時間遅れを選択するのでは時間がかかってしまい、リアルタイムな予測を達成できません。
そこで、x とその時間遅れの選択は事前にオフラインのみで実施しておきます。同じ装置やプラントにおいては、もちろんいろいろな品番や銘柄を生産することもありますが、GAVDS により時間遅れをある幅で選択していることを考えると、事前にある程度の長い期間の (色々なイベントの起こった) データセットで y と関係のある x とその時間遅れを選択していれば、それが新しい状況において変化することはないと想定できます。
不要な x とその時間遅れはオフラインで事前に選択しておき、オンラインでの適応型ソフトセンサーにおけるモデル構築時には選択された x とその時間遅れを使用することにします。また、これにより、オンラインで何回も GAVDS を実施するとたまたま思いもよらない x が選択されてしまうこともありますが、事前に選択して確認しておいた x を使用し続けることで、その問題が発生しなくなります。
もちろん、1回だけ GAVDS を実行するだけでは、重要な x がたまたま選択されないなど、取りこぼしがある可能性も 0 ではありませんが、何回か GAVDS を実行して x とその時間遅れ幅の組み合わせを複数個準備することで、そのような取りこぼしを防ぐことができます。それらの組み合わせで複数の適応型ソフトセンサー (複数のモデル) を構築・運用し、アンサンブル学習により予測します。
以上のように、GAVDS と適応型ソフトセンサーとアンサンブル学習を組み合わせることで、モデルの予測精度を維持しつつ、適切にソフトセンサーを運用しながら y の予測が可能となります。
以上です。
質問やコメントなどありましたら、X, facebook, メールなどでご連絡いただけるとうれしいです。