ケモメトリックス

可視化手法・低次元化手法の分類

説明変数 x の数が大きいときなど、データセットを用いてx を潜在変数 z に変換する手法を用いることがあります。z の数が二つのとき、データの可視化 (見える化) になります。手法の例としては、以下のものが挙げられます。 Principa...

目的変数が複数あるときの解析の方針の決め方

説明変数 x と目的変数 y の間でモデル y = f(x) を構築して、新しいサンプルの x をモデルに入力して y を予測したり、y が望ましい値になる x を設計したり (モデルの逆解析) します。このとき、y が複数あることがありま...

実験計画法で実験条件を決めることの意義

まだ実験データがないときに、実験条件を設定して実験することを考えます。実験条件を人が決めるときは、化学的な背景や物理的な背景を考慮したり、装置などの条件に基づいたりして、実験条件を決めることになります。このとき、ある程度実験条件を振ります。...

モデルの適用範囲の手法やハイパーパラメータの選び方

説明変数 x と目的変数 y の間で構築されたモデル y = f(x) を運用するとき、モデルの適用範囲 (Applicability Domain, AD) が必須になります。AD は、モデルが本来の予測性能を発揮できる x のデータ範囲...

未来予測をするモデルを検証するときの注意点

説明変数 x と目的変数 y の間で構築されたモデル y = f(x) の目的として、未来の予測をすることもあります。未来のことはわからないとはいえ、モデルを構築できるということはデータがあるわけですから、データを用いて、構築されたモデルで...

モデルの予測精度と解釈可能性を両立できる手法を開発しました![金子研論文]

金子研の論文が Journal of Computer Chemistry, Japan に掲載されましたので、ご紹介します。タイトルは Constructing Regression Models with High Prediction...

目的変数に上限や下限があるときの回帰分析の潜在的問題と、その解決方法

回帰分析をするとき、目的変数 y に上限や下限のある変数を使用するときがあります。0 から 1 までの値だったり、0 % から 100 % までの間だったりする変数です。基本的には、回帰分析における y として使用して問題ありません。ただ、...

三つの本の使い分け

2021年8月1日現在、金子弘昌 著の3冊の本が出版されています。 金子研オンラインサロンでは、本の内容に関する質問をいただいたり議論が深まったりして嬉しい限りです。修正点などのご指摘もいただき、実際に私の方で修正し、内容的にもアップデート...

過学習(オーバーフィッティング)が怖いときはアンサンブル学習と組み合わせよう!

過学習 (オーバーフィッティング) した回帰モデルやクラス分類モデルがあるとき、そのようなモデルとアンサンブル学習との相性はよいです。そもそもアンサンブル学習は、精度が低いモデルでもたくさん用いて予測することで、最終的な精度を向上させる学習...

「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」 化学・化学工学のデータ解析・機械学習を学びながら実験計画法やベイズ最適化を実践したい方へ

金子弘昌, 「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」, 講談社, 2021 講談社: Amazon: 自分の本の紹介で恐縮です。ただ、ケモインフォマティクス、マテリアルズインフォマティクス、プロセスインフォマティク...
タイトルとURLをコピーしました