関係ないと思われていた変数の追加&ドメイン知識の活用で、精密電気部品の量産プロセスにおける不良率予測の予測精度が向上し、不良原因の特定に成功しました [金子研論文]

金子研の論文が Analytical Science Advances に掲載されましたので、ご紹介します。タイトルは

 

Defect rate prediction and failure-cause diagnosis in a mass-production process for precision electric components

 

です。

化学プラントや産業プラント、各種装置において、温度・圧力・流量・液レベルなどのプロセス変数が測定され、測定された時系列データを活用してプラントの制御・管理が行われます。例えば、プラントが正常なプロセス状態のときに測定されたデータを用いて、正常なプロセス状態を表すプロセス変数のデータ領域を規定してモデル化します。

プラントにおいて正常データだけでなく異常データが存在する場合や、濃度や密度などの測定困難なプロセス変数を迅速に制御したい場合はソフトセンサーを活用できます。ソフトセンサーとは、温度・圧力・流量・液レベルなどの簡単に測定可能なプロセス変数 x と異常度や濃度・各種物性等の測定困難なプロセス変数 y との間で構築された回帰モデルです。リアルタイムに測定された x の値をモデルに入力することで、y の値を予測でき、その値に基づいて異常を検出したり、プロセス制御したりできます。

y に関連する x を調査する、例えば異常データの原因となるプロセス変数を探索するため、構築された回帰モデルを解釈し、y と X の間の関係を明らかにすることも重要です。本研究では、データセット全体を踏まえて y、例えば異常度との関連の深い x を探索するため、x の重要度について着目します。例えばランダムフォレストの変数重要度により、y を予測する上での x の重要度を求められます。

本研究では、日本のあるメーカーにおける精密電気部品の量産における不良改善を対象としました。プロセスは化学的、物理的な加工を行う11の工程があり、各工程は積み上げ型の加工のため、前工程の出来栄えが以降の工程の結果に影響する性質をもちます。今回対象とした不良は、最終工程まで終了後に初めて良 or 不良の判定ができるものであり、どの工程も原因となりうるため特定が困難でした。工程ごとの装置の処理能力が異なるため、工程によっては複数台の装置を並列に使用しています。また、今回対象とした品種とは別の品種も同じ装置に負荷されます。

今回のプロセスは、工程ごとに規格内で運転しても、工程間の組み合わせによっては最終的に不良になることもあります。11もの工程があるため、すべての工程間の組み合わせを検討することは難しいです。そこで本研究では、メカニズムの考察からは想像できていない工程間の悪条件の組み合わせを考慮するため、製造条件、製造日時、作業者、装置の号機、環境因子、各工程での出来栄え評価等のデータから、精密電気部品の量産プロセスにおける不良率をプロセス変数から予測すること、および不良率が高くなる原因を診断することを目的としました。

不良率に関係があると考えられるプロセス変数および不良率には関係がないと考えられるプロセス変数のデータを収集し、

 

  • ランダムフォレスト (Random Forests, RF)
  • Gradient Boosting Decision Tree (GBDT)
  • eXtreme Gradient Boosting (XGB)
  • Light Gradient Boosting model (LGB)

 

といったプロセス変数の重要度を計算できる手法で回帰分析を行います。構築されたモデルの予測精度を検証し、変数重要度を用いて不良品に関連するプロセス変数の解析を行いました。

最初に、不良率と関連すると考えられたプロセス変数のみを用いたところ、不良率の予測はある程度可能であった一方で、不良原因は見つかりませんでした。そこで、不良率と関連しないと考えていたプロセス変数について、ドメイン知識を活用して変数を変換し、それを含めて解析したところ、不良原因が見つかりました。異常検出や異常原因の診断には、考えうるすべてのプロセス変数を含めることや、ドメイン知識を活用することが重要といえます。

興味のある方は、ぜひ論文をご覧いただければと思います。

 

以上です。

質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。

タイトルとURLをコピーしました