データ解析

化学構造・分子構造を対象にしたデータ解析・機械学習をするときの二次元構造や三次元構造の考え方

ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティックスの中で、化学構造・分子構造を対象にしてデータ解析や機械学習を実施することもあります。化合物の化学構造から分子記述子を計算したり、記述子 x と物性・活性・特...

予測誤差は全部ノイズ!~ノイズを0にする方向で考えよう!~

分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子や合成条件・製造条件・プロセス条件などの説明変数 x と物性・活性・特性などの目的変数 y の間で数理モデル y = f(x) を構築し、構築されたモデルを用いて x の値か...

二つの POL 講演会(ベイズ最適化・Datachemical LAB)を終えて

このたび、2021 年 12 月 21 日と 2022 年 5 月 13 日に、それぞれ POL 様が主催された講演会にて、お話させていただきました。 ① 2021 年 12 月 21 日 ベイズ最適化を駆使した研究・開発~モデル設計と実践...

化学・化学工学分野におけるデータ解析・機械学習クラウドサービス「Datachemical LAB」

化学・化学工学分野におけるデータ解析・機械学習が、プログラミングなしでできるクラウドサービス「Datachemical LAB」を開発し、提供を開始しましたので、ご案内します。プレスリリースは以下をご覧ください。 Datachemical ...

機械学習、特に教師あり学習をする際の特徴量データの準備の方針

分子設計・材料設計・プロセス設計において、分子記述子や合成条件・製造条件やプロセス条件などの特徴量 x と物性・活性・特性などの目的変数 y との間でデータセットに基づいて教師あり学習により数理モデル y = f(x) を構築したり、構築し...

特徴量選択するときのモデルのハイパーパラメータの決め方

分子記述子・合成条件・製造条件・プロセス条件・プロセス変数などの特徴量 x と物性・活性・特性などの目的変数 y との間で数理モデル y = f(x) を構築するとき、モデルの予測精度を向上させたり、モデルの解釈性を上げたりするために、x ...

GMR と GA を用いた逆解析の結果の扱い方

分子設計・材料設計・プロセス設計において分子記述子・合成条件・製造条件・プロセス条件などの特徴量 x と物性・活性・特性などの目的変数 y との間で数理モデル y = f(x) を構築し、そのモデルを活用して y の目標値を達成するための ...

Elastic net をすれば、OLS, RR, LASSO はしなくてよいのか?

こちら↓で解説したように、最小二乗法による線形重回帰分析 (Ordinary Least Squares, OLS), リッジ回帰 (Ridge Regression, RR), Least Absolute Shrinkage and S...

結局、「次元の呪い」は何が問題なのか?解決方法は?

データ解析や機械学習をしている方は、「次元の呪い」 という問題があることを聞いたことがあるかもしれません。「次元」という言葉があるように、分子記述子・合成条件・製造条件・プロセス条件・プロセス変数などの変数もしくは特徴量が多いときに生じる問...

時系列データにおけるモデル適用範囲

目的変数 y と説明変数 x のデータを準備して、x と y の間で数理モデル y = f(x) を構築し、モデルに基づいて x の値から y の値を予測したり、y の値が目標値になるような x の値を設計したりします。モデルで予測するとき...
タイトルとURLをコピーしました