金子研の論文が Analytical Science Advances に掲載されましたので、ご紹介します。タイトルは
Adaptive soft sensor based on transfer learning and ensemble learning for multiple process states
です。これは修士卒の山田 信仁さんが修士のときに取り組んだ研究の成果です。
装置やプラントでは、プロセス状態の変化に対応するため、装置やプラントで測定される新たなデータを活用してソフトセンサーを更新・再構築する適応型ソフトセンサーが用いられています。本研究では適応型ソフトセンサーの一つとして Locally-Weighted Partial Least Squares (LWPLS) に着目しました。
装置やプラントでは、一つの銘柄の製品を常に生産するのではなく、複数の銘柄を切り替えて生産する場合があります。複数の銘柄を切り替えて生産するプロセスにおいて、全銘柄のデータを用いて構築されたソフトセンサーの予測精度が十分でない、すなわちグローバルなモデルでは予測精度が低いとき、一般的には銘柄ごとのデータを用いてローカルなソフトセンサーを構築します。
データが十分にある銘柄のソフトセンサーは問題ないですが、あまり生産されない銘柄や新しい銘柄では、サンプル数が少ない、もしくはサンプルがないため、安定的なソフトセンサーの構築が難しかったり、そもそもソフトセンサーを構築できなかったりします。
各銘柄のデータのみを使用するだけでなく、類似した他の銘柄のデータも考慮してソフトセンサーを構築することで予測精度が向上する考え、転移学習を活用します。
転移学習では、ある銘柄のソフトセンサーを構築する際、その銘柄のサンプルだけではなく、他の銘柄のサンプルやそのサンプルから得られる情報を使用します。転移元のサンプルを source domain (SD)、転移先のサンプルを target domain (TD) と呼びます。
特に多種多様な銘柄が製造されているとき、SD は一つではなく複数存在します。このとき、単一の SD を使用するより、複数の SD を使用した手法の方が予測精度や運用の面で優れていることがわかっています。そこで転移学習にアンサンブル学習を組み合わせ、さまざまな銘柄のデータを転移学習させます。
ただ、いつも転移学習を活用すればよいわけではなく、TD と関係のないサンプルで転移学習をしてしまうと、転移させる前と比較して予測精度が低下してしまいます。いわゆる negative transfer です。適応型ソフトセンサーを運用する際は、negative transferを考慮する必要があります。適応型ソフトセンサーの転移学習において、TD がある程度蓄積したら、negative transfer の観点から SD の転移は止めるべきと考えました。
以上をふまえて今回は、複数のプロセス状態がある状況における、転移学習を活用した新たな適応型ソフトセンサーを開発しました。SD ごとに閾値を算出し、閾値よりも TD のサンプルが少なければ転移学習を使用した適応型ソフトセンサーとします。一方、閾値よりも TD のサンプルが多ければ転移学習を使用せず、TD のみを使用した適応型ソフトセンサーとします。そして、アンサンブル学習により複数の SD に基づく適応型ソフトセンサー (SD が使われない適応型ソフトセンサーも含む) を統合して、最終的な予測値を計算します。
住友化学株式会社のプラントデータを使用させていただき、以下の3つの状況において、提案手法により適切な適応型ソフトセンサーを運用できることを確認しました。
- 銘柄切り替えを行いながら製品を生産
- 過去に少量生産したことがある銘柄の製品を再び生産
- 過去に生産したことがない銘柄の製品を生産
興味のある方は、ぜひ論文をご覧いただければと思います。どうぞよろしくお願いいたします。
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。