今回はデータ解析によって構築した回帰モデルやクラス分類モデルの使い方についてお話しします。使い道は大きく二つに分けられます。一つはモデルの逆解析、もう一つは目的変数 Y の評価です。

モデルの逆解析

モデルの逆解析では、Y の値が望ましい値になるように、モデルを用いて説明変数 X の値を設計します。詳細はこちらをご覧ください。

回帰モデル・クラス分類モデルの逆解析～目標のY(物性・活性など)を達成するためのX(説明変数・記述子・特徴量・パラメータ・入力変数)とは？～

回帰モデルやクラス分類モデルが得られたあとの話です。よくやるのは、説明変数 (記述子・特徴量・パラメータ・入力変数) X の値を回帰モデルやクラス分類モデルに入力して、目的変数 Y の値を推定することです。これをモデルの順解析とよびます。そ...

モデルの逆解析をするときのチェックリスト

回帰モデルやクラス分類モデルを構築したら、モデルの逆解析を行うことで、目的変数の目標値を達成すると考えられる説明変数の値を推定できます。ただ、モデルの逆解析をするときは、いくつか注意点がありますので、チェックリストとしてまとめました。モデル...

基本的にはモデルの適用範囲 (Applicability Domain, AD) 内で X の値を設計することになりますが、

モデルの適用範囲・モデルの適用領域 (Applicability Domain, AD) ～回帰モデル・クラス分類モデルを使うとき必須となる概念～

今回は、モデルの適用範囲・モデルの適用領域 (Applicability Domain, AD) についてです。AD は回帰モデル・クラス分類モデルが本来の性能を発揮できるデータ領域のことです。回帰モデル・クラス分類モデルを使うとき必須にな...

例えば回帰分析においては、既存の Y の値を超越するような X の値を設計する必要があることもあります。その場合には、繰り返し実験することを前提としてベイズ最適化で X の値を設計するとよいでしょう。

ベイズ最適化(Bayesian Optimization, BO)～実験計画法で使ったり、ハイパーパラメータを最適化したり～

ガウス過程による回帰をうまく使って、実験計画法における新しい実験候補を探索したり、回帰モデルやクラス分類モデルのハイパーパラメータ (学習では求まらないため事前に決めるべきパラメータ) を決定する方法が、ベイズ最適化 (Bayesian O...

ベイズ最適化で期待できること

材料の活性・物性・特性は、化学構造だけで変化するものではなく、材料の作り方、つまり実験条件や製造条件によっても変化します。例えば高分子設計において、単量体 (モノマー) の化学構造だけでなく、そのモノマーの種類・組成比や、反応温度や反応時間...

モデルの逆解析により、比較的に少ない実験回数で、効率的に X の値を設計できるようになります。AD 内で X の値を設計するのか、ベイズ最適化を利用するかについては、こちらの記事をご覧ください。

守りの AD 攻めの BO (AD: モデルの適用範囲、BO: ベイズ最適化)

分子設計でも材料設計でもプロセス設計でも、説明変数 X と目的変数 Y のそろったデータセットを準備して、X と Y の間でモデル Y = f(X) を構築します。構築したモデルを用いて、Y が目標の値となるような X の候補を設計します。...

目的変数 Y の評価

もう一つのモデルの使い方としては、Y の値の評価です。例えば、ある化合物がどの程度の毒性をもつか評価したり、他にも材料などの物性や特性の値が規格内かどうか評価したりします。ソフトセンサーも Y の値の評価ですね。

適応型ソフトセンサーで産業プラントにおけるプロセス状態等の変化に対応する (Adaptive Soft Sensor)

化学プラント・産業プラントにおいて、測定することが難しいプロセス変数の値を、コンピュータでリアルタイムに推定するため、ソフトセンサーが活用されています。“ソフトセンサー” とかっこいい名前がついていますが、結局はあるいくつかのプロセス変数 ...

ちょっとソフトセンサーを試してみたいという方へ、プログラミング不要で実行できるアプリ「DCE soft sensor」を作りました。ご自由にお使いください

ソフトセンサーを試してみたい、プラントのデータを使ってソフトセンサーで推定してみたら、どれくらいの誤差で推定できるのか確認してみたい、という方はいらっしゃると思います。試してみて良い結果が出ると、さらにソフトセンサーを勉強するモチベーション...

もしくは、ある実験条件の値から少し値がズレたときに、どの程度 Y の値がばらつくか、といったことも評価にあたります。なおモデルの逆解析のとき、この Y の値のばらつきについても考慮する方法についてはこちらに記載した通りです。

目的変数の予測値だけでなく、説明変数の感度も設計のときに考慮する

プロセス・マテリアルズ・ケモインフォマティクスオンラインサロン (金子研オンラインサロン) をやっていまして、そこで興味深い質問があり、回答しました。今回は回答した内容を少し膨らませて、こちらの記事でもお話したいと思います。材料設計やプロセ...

評価においては基本的に AD 内で議論をすべきです。 AD を超えた X の値に関しては、評価できないとか、評価された値には大きなばらつきがある、といった結果として考えるとよいと思います。

評価においても、本来であれば実験で評価するべきところをモデルによって評価することで、実験回数を減らすことができます。ある X の値付近での Y の値のばらつきの評価においても、そのための評価実験をすることなく評価できます。選挙において出口調査などの情報により開票率 0 % でも当確確定が出るようなことでしょうか。

以上のような、モデルを使うときに逆解析をするのか、Y の評価をするのか意識して使い分けると、それぞれにおいて適切な使い方ができ、必要なことが整理され、議論がスムーズになると思います。

以上です。

質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。