プロセス制御・プロセス管理・ソフトセンサー

プロセスインフォマティックスで時系列データをどのように扱うか?

プロセスインフォマティクスの特徴の一つとして、扱うデータに時系列データが含まれていることがあります。分子や材料の特徴量のデータとは、また別の取り扱いをする必要があります。温度、圧力、流量、滴下量、・・・といったプロセス変数が時間変化をしまし...

モデル構築のときに特徴量の重要度を考慮した方がよいか

説明変数 x と目的変数 y の間で回帰モデルやクラス分類モデルを構築するとき、いろいろな回帰分析手法やクラス分類手法があります。x のすべての特徴量が平等に重要な場合もあれば、x の中に重要な特徴量もあり重要でないノイズのような特徴量もあ...

材料開発の限界を検討するための機械学習からの情報

分子設計・材料設計・プロセス設計において、分子や合成条件・製造条件やプロセス条件の特徴量 x と材料の物性や活性 y との間で機械学習により数理モデル y = f(x) を構築し、モデルを用いて次の分子や合成条件・製造条件やプロセス条件を設...

遺伝的アルゴリズムの実行結果は変化しやすく、またオーバーフィットしやすい、その対処法とは?

遺伝的アルゴリズム (Genetic Algorithm, GA) などの最適化アルゴリズムを駆使して、何らかの問題における最適解を探索することが行われます。例えば変数選択もしくは特徴量選択において GA を用いるときには、GA の染色体で...

新たなプログラムを作成する流れ~言語化が一番大事~

ケモインフォマティクスやマテリアルズインフォマティクスやプロセスインフォマティックスの研究をするなかで、手法の開発するときには、何らかのプログラミング言語でプログラムを作成することが必要になります。ちなみに金子研 (データ化学工学研究室) ...

任意のクラスタリング手法においてクラスター数を自動的に決める方法

回帰分析やクラス分類などの教師あり学習における各手法のハイパーパラメータ (PLS における成分数や SVR における C, ε など) と比べて、データの可視化やクラスタリングなどの教師なし学習における各手法のハイパーパラメータ (t-S...

ベイズ最適化と遺伝的アルゴリズム(などの組合せ最適化アルゴリズム)の本質的な違いとは?

分子設計や材料設計やプロセス設計において、分子や合成条件や実験条件やプロセス条件などの説明変数 x と物性や活性などの目的変数 y との間でガウス過程回帰 (Gaussian Process Regression, GPR) モデルを構築し...

モデルの予測精度を上げればゴール?~真の目的をふまえて解析しよう!~

分子設計や材料設計やプロセス設計において、分子記述子や合成条件や実験条件やプロセス条件などの説明変数 x と物性や活性などの目的変数 y との間でモデル y = f(x) を構築し、そのモデルを用いて新たな分子や材料の化学構造や合成方法やプ...

すべてを機械学習でやらなくてもよいです!

分子設計・材料設計・プロセス設計において、実験条件・合成条件・プロセス条件などの説明変数 x と物性・活性などの目的変数 y との間でモデル y = f(x) を構築し、モデルに基づいて y が所望の値となる x の値を設計することが行われ...

0を含む変数を対数変換するときはどうすればよいのか?

説明変数 x と目的変数 y との間で回帰モデル y = f(x) を構築するとき、x と y の間の関係を的確に表現したり、モデルの予測精度を向上させたりするため、y を対数変換して用いることがあります。化学的・物理的な背景や x と y...
タイトルとURLをコピーしました