ケモメトリックス

単体・化合物と実験条件・製造条件の両方が変わるデータセットの解析の仕方

データセットを用いて説明変数 X と目的変数 Y との間でモデル Y = f(X) を構築するときの話です。材料のデータセットを扱うときは、X が化合物の化学構造や結晶構造や金属の特徴量だったり、単体や化合物の組成比だったり、その他の実験条...

オーバーフィッティング(過学習)の本質を理解して実用的な議論をする

回帰分析やクラス分類を行うとき、オーバーフィッティング(過学習)をしないことが重要といわれます。 オーバーフィッティングを防ぐため、クロスバリデーションでハイパーパラメータを決めたり、テストデータを用いて回帰分析手法やクラス分類手法を選んだ...

モデルの直接的逆解析法で効率的な適応的実験計画法ができるようになりました![金子研論文]

金子研の論文が Chemometrics and Intelligent Laboratory Systems に掲載されましたので、ご紹介します。タイトルは Adaptive design of experiments based on ...

どうしてGMRやGTMRといったモデルの直接的逆解析法は良好な結果を生み出すのか?

回帰モデルを直接的に逆解析ができる、すなわち説明変数 X から目的変数 Y (Y が複数でもOK!) を直接的に推定できる手法である Gaussian Mixture Regression (GMR) や Generative Topogr...

説明変数の重要度を考慮した新たな非線形サポートベクター回帰(SVR)を開発しました![金子研論文]

金子研の論文が Journal of Chemometrics に掲載されましたので、ご紹介します。タイトルは Support vector regression that takes into consideration the impo...

材料の結晶構造を考慮して熱電変換材料を設計しました![金子研論文]

金子研の論文が Analytical Science Advances に掲載されましたので、ご紹介します。タイトルは Design of thermoelectric materials with high electrical cond...

「エンジニアのための実践データ解析」 データ解析をすぐに実践したい方が読む本

藤井宏行, 「エンジニアのための実践データ解析」, 東京化学同人, 2005 東京化学同人: Amazon: もともとは化学工学会の学会誌に連載されていた “ケミカルエンジニアのための統計的品質管理入門” の内容を加筆修正された本です。学生...

ベイズ最適化で複数の目的変数がある場合の対応[Probability of Improvement(PI)以外]

適応的実験計画法により、高機能性材料を達成するための実験条件・製造条件を探索したり、高性能プロセスを開発するためのプロセス条件を探索したりするとき、ベイズ最適化を用いることで効率的に外挿を探索しながら目標達成を目指すことができます。設計問題...

回帰係数=寄与度とすることは危険、どうしても寄与度を求めたいときはPCRやPLSの1成分モデルで、ただ基本的には寄与度ではなく重要度で議論

タイトルで言いたいことはほとんど言っていますが、丁寧に説明します。たとえば最小二乗法による線形重回帰分析や部分的最小二乗回帰 (Partial Least Squares Regression, PLS) や Least Absolute ...

データセット作成のときに注意する6つのこと

データ解析・機械学習を行うためには、データセットが必須です。エクセルファイルや実験ノートなどからデータを集めて、整理してまとめると思います。そのようにしてデータセットを作成するとき、注意することがあります。6つそれぞれ説明します。 1. x...
タイトルとURLをコピーしました