化学・化学工学分野におけるデータ解析・機械学習クラウドサービス「Datachemical LAB」の新機能についてです。プレスリリース↓
いろいろな所で紹介させていただいている通り、Datachemical LAB を使用することで、データの前処理・データの可視化・回帰分析・モデルの逆解析・モデルの適用範囲・化学構造生成・(適応的)実験計画法・能動学習・ベイズ最適化などの、データ解析・機械学習が可能になります。
今回はソフトセンサーや異常検知の機能が追加されましたので説明します。ちなみに、ソフトセンサーや異常検知そのものについてはこちら↓をご覧ください。
こちらの書籍↓には、ソフトセンサーや異常検出について実例とともに丁寧に書かれています。
ソフトセンサーや異常検知が追加され、Datachemical LAB のメニューにも、ソフトセンサーと異常検知が増えています。
ソフトセンサー
まずソフトセンサーについてです。抽象的に考えれば、回帰分析や予測であり、Datachemical LAB の MI セクションでも検討される回帰モデルやモデルの最適化です。では、ソフトセンサーは MI セクションと何が違うかというと、大きく二つあります。
一つはソフトセンサーで扱うデータが時系列データであることから、ソフトセンサーでは時間の情報を考慮してモデル最適化を行うことができます。具体的には、y に対して x がどれくらい遅れて影響しているかを検討できます。反応器の滞留時間などに由来する装置やプラントの動特性・ダイナミクスがありますので、x から y を精度よく予測するため、動特性・ダイナミクスの検討をします。
もう一つは、ソフトセンサーを実運用するとき、新たなサンプル、すなわち新たに y が測定されたデータが増えることになります。そういったデータを使用して自動的にモデルを再構築・更新する仕組みがあります。いわゆる適応型ソフトセンサーです。
Datachemical LAB では適応型ソフトセンサーとして、moving window (MW) と Just-In-Time (JIT) が搭載されています。さらに、JIT の中でもよく使用されている回帰分析手法である局所 PLS (Locally-Weighted PLS, LWPLS) もあります。
トレーニングデータとテストデータに分けて (適応型) ソフトセンサーの予測精度を検証でき、
- y に対して x をどのくらい遅らせればよいのか?(動特性はどのように設定すればよいのか?)
- どの適応型ソフトセンサーがよいのか?
- 回帰分析手法はどれがよいのか?
について、総合的に最適化できます。以下のような予測結果も確認しながら、検討することが可能です。
回帰分析手法としてガウス過程回帰 (LGPR や種々の NGPR) を選べば、上の2つ目の図のように、予測値の標準偏差 (エラーバー) も同時に推定できます。
さらに、最適化した動特性・適応型ソフトセンサー・回帰分析手法は、そのまま装置やプラントにおけるソフトセンサー運用に使用できます。Datachemical LAB 自体はウェブサービスですが、ソフトセンサーと異常検知については、パソコンにインストールしてオンライン予測できるアプリも付属しています。これを使えば、装置やプラントの運転データを csv ファイルとしてパソコンに保存し、運転データからソフトセンサーで y を予測して予測値を出力したり、適応型ソフトセンサーを運用して自動的にモデル更新したりすることが可能になります。
アプリは Datachemical LAB に付属されていますので、ライセンスをお持ちの方はどなたでもアプリを使用できます。Datachemical LAB でのソフトセンサーの詳細検討から、ソフトセンサーの実運用まで、とてもスムースに行えます。ぜひご検討いただければと思います。
異常検知
続いて異常検知です。異常検知では、装置やプラントが正常な状態で測定されたプロセス変数の値のデータを用いて、装置やプラントが正常に運転するデータ領域をモデル化します。新しい時刻の測定データが、正常なデータ領域の中であれば、正常と判断され、領域の外であれば、異常と診断され検知されます。
考え方としてはモデルの適用範囲と似ています。
実際、異常検知とモデルの適用範囲とで、同様の手法が使用されていることがあります。Datachemical LAB の異常検知では、主成分分析に基づく T2 統計量や Q 統計量による方法、k 最近傍法による方法、OCSVM を用いた方法が実装されています。
モデル構築用データだけでなく、予測用データを設定でき、新たなサンプルに対する異常検知の性能も検証できます。
異常検知についてもソフトセンサーと同様に時系列データであるため、装置やプラントの動特性・ダイナミクス、すなわちプロセスの異常に対する x の時間遅れの検討も可能です。
さらに、時間遅れや異常検知の手法を Datachemical LAB で検討した後に、ソフトセンサーと同様にパソコンにインストールしてオンライン予測できるアプリで異常検知を実運用できます。実際の装置やプラントでデータが測定され、csv ファイルとして保存されたり csv ファイルが更新されたりする中で、そのファイルのデータを自動的に読み取って、その時刻の装置やプラントが正常か異常か判断できます。
以上のように、Datachemical LAB にソフトセンサーと異常検知の機能が追加され、さらにそれらを実際に運用できるデスクトップアプリも開発しました。すでに Datachemical LAB のライセンスをお持ちの方は、以上のすべての機能をご利用可能です。これからライセンスを購入される方も、同様にすべて利用できますので、これまでの機能と一緒に、ぜひ Datachemical LAB をご検討いただければと思います。
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。