ケモインフォマティクス

特徴量を抽象化して、モデルの逆解析により得られるサンプルの多様性を高める

目的変数 Y と説明変数 X の間で回帰モデルやクラス分類モデル Y = f(X) を構築して、Y がわからない X の値をモデルに入力することで、Y を予測することが行われています。予測精度の高いモデルを構築するためには 適切に X を設...

特徴量に関する基本的な考え方~複数の物質が混合されてできた物質~

ポリマー設計において、共重合体 (コポリマー) の特徴量を考えるとき、各モノマーを数値化した後に、それらのモノマーの組成比を重みとした重みつき平均 (加重算術平均もしくは単に加重平均) を計算することで数値化することがあります。また合金の特...

データの可視化をする理由

分子設計・材料設計・プロセス設計・ソフトセンサーなどにおいて、データ解析をするとき、目的としては Y の値を予測することや Y の値が目標を達成する X の値を設計することです。そのため主な解析手法は回帰分析手法やクラス分類手法になります。...

モデルの使い方~モデルの逆解析と目的変数の評価~

今回はデータ解析によって構築した回帰モデルやクラス分類モデルの使い方についてお話しします。使い道は大きく二つに分けられます。一つはモデルの逆解析、もう一つは目的変数 Y の評価です。 モデルの逆解析 モデルの逆解析では、Y の値が望ましい値...

目的変数の予測値だけでなく、説明変数の感度も設計のときに考慮する

プロセス・マテリアルズ・ケモインフォマティクスオンラインサロン (金子研オンラインサロン) をやっていまして、 そこで興味深い質問があり、回答しました。今回は回答した内容を少し膨らませて、こちらの記事でもお話したいと思います。 材料設計やプ...

守りの AD 攻めの BO (AD: モデルの適用範囲、BO: ベイズ最適化)

分子設計でも材料設計でもプロセス設計でも、説明変数 X と目的変数 Y のそろったデータセットを準備して、X と Y の間でモデル Y = f(X) を構築します。構築したモデルを用いて、Y が目標の値となるような X の候補を設計します。...

異常検出を気軽に試したい方へ、プログラミング不要で実行できるアプリ「DCE fault detection」を作りました。ご自由にお使いください。ちなみにモデルの適用範囲(AD)の設定にも使えます

異常検出を試してみたい、プラントのデータを使って異常なのか正常なのか推定してみたら、どれくらいの異常を推定できるのか確認してみたい、という方はいらっしゃると思います。 試してみて良い結果が出ると、さらに異常検出について勉強するモチベーション...

ガウシアンカーネルを用いた SVR ではモデルの適用範囲を考慮しなくてよいの?!

目的変数 Y と説明変数 X との間で回帰モデル Y = f(X) を構築するとき、基本的にモデルの適用範囲 (Applicability Domain, AD) を設定する必要があります。AD の詳細はこちらをご覧ください。 回帰分析手法...

木を見ず枝を見ろ!~精度の低い決定木モデルの活用法~

決定木で回帰分析やクラス分類を行うときの話です。 決定木では、他の手法と比べて回帰モデルやクラス分類モデルの予測精度が低くなってしまうことがあると思います。こんなとき、もう決定木は用済み、としてしまうのはもったいないかもしれません。 決定木...

データ解析前における、説明変数(特徴量・記述子)の決め方・選び方の方針

目的変数 Y と説明変数 (特徴量・記述子) X との間に、クラス分類や回帰分析によってモデル Y = f(X) を構築します。モデルを構築するためにはデータセットが必要ですので、Y, X を決めてからサンプルを集めなければなりません。モデ...
タイトルとURLをコピーしました