データ解析

モデルの適用範囲の手法やハイパーパラメータの選び方

説明変数 x と目的変数 y の間で構築されたモデル y = f(x) を運用するとき、モデルの適用範囲 (Applicability Domain, AD) が必須になります。AD は、モデルが本来の予測性能を発揮できる x のデータ範囲...

未来予測をするモデルを検証するときの注意点

説明変数 x と目的変数 y の間で構築されたモデル y = f(x) の目的として、未来の予測をすることもあります。未来のことはわからないとはいえ、モデルを構築できるということはデータがあるわけですから、データを用いて、構築されたモデルで...

モデルの予測精度と解釈可能性を両立できる手法を開発しました![金子研論文]

金子研の論文が Journal of Computer Chemistry, Japan に掲載されましたので、ご紹介します。タイトルは Constructing Regression Models with High Prediction...

目的変数に上限や下限があるときの回帰分析の潜在的問題と、その解決方法

回帰分析をするとき、目的変数 y に上限や下限のある変数を使用するときがあります。0 から 1 までの値だったり、0 % から 100 % までの間だったりする変数です。基本的には、回帰分析における y として使用して問題ありません。ただ、...

三つの本の使い分け

2021年8月1日現在、金子弘昌 著の3冊の本が出版されています。 金子研オンラインサロンでは、本の内容に関する質問をいただいたり議論が深まったりして嬉しい限りです。修正点などのご指摘もいただき、実際に私の方で修正し、内容的にもアップデート...

過学習(オーバーフィッティング)が怖いときはアンサンブル学習と組み合わせよう!

過学習 (オーバーフィッティング) した回帰モデルやクラス分類モデルがあるとき、そのようなモデルとアンサンブル学習との相性はよいです。そもそもアンサンブル学習は、精度が低いモデルでもたくさん用いて予測することで、最終的な精度を向上させる学習...

「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」 化学・化学工学のデータ解析・機械学習を学びながら実験計画法やベイズ最適化を実践したい方へ

金子弘昌, 「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」, 講談社, 2021 講談社: Amazon: 自分の本の紹介で恐縮です。ただ、ケモインフォマティクス、マテリアルズインフォマティクス、プロセスインフォマティク...

直接的逆解析法では特徴量の制約、定性的な特徴量、転移学習も扱えます

金子研で開発している直接的逆解析についてです。 (直接的逆解析ではない) いわゆる一般的な逆解析では、モデルを構築した後に、説明変数 x の大量のサンプルを生成し、構築したモデルに入力し、目的変数 y の値を予測します。そして予測値が良さそ...

「Pythonで気軽に化学・化学工学」 Python プログラミングを学びながら化学・化学工学のデータ解析・機械学習をしたい方へ

金子弘昌, 「Pythonで気軽に化学・化学工学」, 丸善, 2021 丸善: Amazon: Amazon(Kindle): 自分の本の紹介で恐縮です。ただ、データ解析や機械学習による分子設計、材料設計、プロセス設計、プロセス管理・制御を...

モデルの逆解析をふまえた特徴量設計

既存のデータセットを用いて、説明変数 x と目的変数 y の間で、回帰分析手法やクラス分類手法により、モデル y = f(x) を構築したり、構築したモデルを用いて、望ましい y の結果になるように x の値を設計したりします。予測精度の高...
タイトルとURLをコピーしました