ケモメトリックス

乱数を上手く使うとモデルがオーバーフィッティングしているかどうか確認できます

説明変数 x と目的変数 y との間で数理モデル y = f(x) を構築するとき、構築されたモデルがオーバーフィッティングしているかどうか気になるときがあります。 もちろんトレーニングデータとテストデータに分割してテストデータで検証したり...

原理的に0以下にならない目的変数の値を、小さくしたいときのベイズ最適化

分子設計・材料設計・プロセス設計において、分子記述子・合成条件・製造条件・プロセス条件などの説明変数 x と物性・活性・特性などの y との間で数理モデル y = f(x) を構築して、x の値から y の値を予測したり、y が目標の値とな...

金子研で研究員を募集するとしたら?

今すぐというわけではありませんか、予算を確保できたときには、ポスドクを含む研究員を雇う予定でいます。今回は、その状況になったときのための整理をする記事になります。 基本的に研究員の方には、化学や化学工学のデータを扱った機械学習・データ解析を...

決定木やランダムフォレストを回帰分析でどのように活用するか?

今回は決定木やランダムフォレストの活用方法についてです。 というのも、決定木やランダムフォレストをクラス分類に用いるときは特に関係ないのですが、回帰分析に用いるときは、決定木やランダムフォレストによって構築されたモデルの特徴の一つに、目的変...

モデルの適用範囲を広げるにはどうすればよいのか?

分子設計・材料設計・プロセス設計を行うとき、分子記述子や材料の合成条件・製造条件やプロセス条件などの特徴量 x と物性・活性・特性など y との間で、データを用いて数理モデル y = f(x) を構築します。そして、そのモデルを用いて x ...

今あるデータセットに対して、どの手法を使えばよいのか?

説明変数 x と目的変数 y の間で回帰モデル・クラス分類モデル y = f(x) を構築して、構築されたモデルを用いて x の値から y を予測したり、逆に y の値が目標値になるように x の値を設計したりします。このような数理モデルが...

Gaussian Mixture Regression の真の順解析・逆解析をする手法を開発しました![金子研論文]

金子研の論文が Science and Technology of Advanced Materials: Methods に掲載されましたので、ご紹介します。タイトルは True Gaussian Mixture Regression a...

有機過酸化物の自己促進分解温度を予測するモデルを開発しました![金子研論文]

金子研の論文が ACS Omega に掲載されましたので、ご紹介します。タイトルは Development of Prediction Models for the Self-Accelerating Decomposition Tempe...

プロセスインフォマティックスで時系列データをどのように扱うか?

プロセスインフォマティクスの特徴の一つとして、扱うデータに時系列データが含まれていることがあります。分子や材料の特徴量のデータとは、また別の取り扱いをする必要があります。温度、圧力、流量、滴下量、・・・といったプロセス変数が時間変化をしまし...

モデル構築のときに特徴量の重要度を考慮した方がよいか

説明変数 x と目的変数 y の間で回帰モデルやクラス分類モデルを構築するとき、いろいろな回帰分析手法やクラス分類手法があります。x のすべての特徴量が平等に重要な場合もあれば、x の中に重要な特徴量もあり重要でないノイズのような特徴量もあ...
タイトルとURLをコピーしました