データ解析

良くない実験結果も、データ解析・機械学習するときは大事なデータです

分子設計や材料設計において、これまでの実験データを活用して、よりよい高機能性材料を達成するための化学構造や実験条件 (実験レシピ) を設計することを考えます。このウェブサイトにいろいろと書いてあるように、たとえば化合物のもつ物性や活性 Y ...

内挿・外挿は、モデルの適用範囲内・適用範囲外と違いますので注意が必要です

回帰分析やクラス分類によって構築された、目的変数 Y と説明変数 X との間のモデル Y = f(X) についてです。 モデルについて議論するとき、モデルはデータの外挿は予測できない、内挿しか予測できない、とか、その予測結果は内挿なの?外挿...

[法人向け] 機械学習・データ解析・化学構造の扱い・Pythonに関するハンズオンセミナー (体験学習) の動画

これまで、いろいろな企業やセミナーにおいて、ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクスの講義や、Python のハンズオンセミナーを行って参りまして、そのような経験・実績をふまえて、以下の動画を作成い...

モデルの精度が低いときも、モデルの逆解析ってやるべき?

いろいろと共同研究やコンサルティングをしていますと やはり多いのは、モデルの逆解析です。 新たな分子を設計したり、新たな材料を作るための実験レシピやプロセスを設計したり、装置を設計したりといった話です。 モデルの逆解析をするためには、もちろ...

ベイズ最適化において一度に複数の実験をするときに候補を選択するシンプルな方法

ベイズ最適化において、複数の実験候補を選択するお話です。ベイズ最適化についてはこちらをご覧ください。 ベイズ最適化では、以下の 1. – 4. を繰り返すことで、物性や活性などの目的変数 Y が向上したり目標値を達成したりできる、実験条件な...

[Pythonコードあり] 特徴量ごとや特徴量間に制限があるときの、モデルの逆解析用のサンプル生成

回帰モデルやクラス分類モデルを構築した後の、モデルの逆解析の話です。 上の 既存のサンプルの分布に従うように、モデルの逆解析用のサンプルをたくさん生成する方法 では、既存のサンプルのデータ分布を求めて、その分布に従うようにして新たなサンプル...

[Pythonコードあり] 既存のサンプルの分布に従うように、モデルの逆解析用のサンプルをたくさん生成する方法

回帰モデルやクラス分類モデルを構築した後は、モデルの逆解析をします。 説明変数 (特徴量・記述子など) X のサンプルをたくさん生成して、それらをモデルに入力することで、目的変数 (活性・物性など) Y の値を推定します。推定された値が、よ...

ベイズ最適化で期待できること

材料の活性・物性・特性は、化学構造だけで変化するものではなく、材料の作り方、つまり実験条件や製造条件によっても変化します。例えば高分子設計において、単量体 (モノマー) の化学構造だけでなく、そのモノマーの種類・組成比や、反応温度や反応時間...

サンプルを集めるときに意識するとよいこと [データベース作成]

分子設計や材料設計をするときや、プラントにおいてソフトセンサーを検討しようとするとき、 (分子設計・材料設計・ソフトセンサーについてはこちら) それぞれ、何らかの数値モデルを構築することになります。データ解析・機械学習を駆使してモデルを構築...

プログラミングを始めるときに入門書を使うべきか、使わないべきか

「プログラミングをはじめたいのですが、入門書はどれがよいですか?」 「学生が使っているプログラミングの入門書はどれですか?」 といった質問をよくいただきます。実は、金子研でオススメのプログラミング入門書があるわけではなく、学生に入門書を使う...
タイトルとURLをコピーしました