プログラミング

[無料公開] 「化学・化学工学のための実践データサイエンス―Pythonによるデータ解析・機械学習―」 の “まえがき”、目次、第1・2章

2022 年 10 月 5 日に、金子弘昌著の「化学・化学工学のための実践データサイエンス―Pythonによるデータ解析・機械学習―」が出版されます。 朝倉書店: Amazon: これまで他に、三冊の本...

Cross-validated Permutation Feature Importance(CVPFI)~任意の回帰分析手法で、説明変数間の相関関係を考慮しながら安定的に変数重要度(特徴量重要度)を計算する手法[金子研論文]

金子研の論文が Analytical Science Advances に掲載されましたので、ご紹介します。タイトルは Cross-validated permutation feature importance consid...

SELFIESに基づいてシンプルに新規な化学構造を生成するPythonコードをDCEKitに公開します!

(アイキャッチ画像は、Midjourney にて chemical structures, molecules, organic chemistry, benzene, carbon, hydrogen で描画) データ解析・機械学習...

Datachemical LABで解ける実践的な課題

Datachemical LAB をご利用いただき、皆様どうもありがとうございます。 分子設計・材料設計・プロセス設計におけるいろいろな問題・課題に対して、ご活用いただいているようで開発者としてとても嬉しい限りです。ご...

サンプルをグループごとにトレーニングデータとテストデータに分割する機能をDCEKitに搭載しました!

回帰モデルやクラス分類モデルの予測性能を評価するとき、トレーニングデータとテストデータにサンプルを分割して、トレーニングデータでモデルを構築し、テストデータで構築されたモデルを評価します。一般的には、scikit-learn の train...

データは嘘をつかないので、データを集めたりデータから得られる結果を解釈したりするときにデータに嘘をつかないようにする

分子や材料やプロセスのデータを扱い、データ解析・機械学習をします。その結果、数理モデルが得られたり、数理モデルに基づいて新たな材料や分子や材料やプロセスを設計できたりします。 データ解析や機械学習で扱われるデータは、多くの場合、人が集...

公開動画

これまでデータ化学工学研究室 (金子研究室) 関係で公開されている動画をまとめます。公開動画が追加され次第、新しい順に追加していきます。 ・2022 年 5 月 20 日 第25回ケムステVシンポジウム「データサイエンスが導...

GridSearchCVでハイパーパラメータの最適化に失敗した時の原因と対処法

回帰モデルやクラス分類モデルにおけるハイパーパラメータを最適化するため、scikit-learn の GridSearchCV を使用する人がいらっしゃると思います。特に複数の種類のハイパーパラメータがあるとき、GridSearchCV を...

回帰分析手法やクラス分類手法のハイパーパラメータをベイズ最適化で高速に最適化する

DCEKit に搭載されている Gaussian Mixture Regression (GMR) や Variational Bayesian Gaussian Mixture Regression (VBGMR) について、 ...

時系列データにおけるモデル適用範囲

目的変数 y と説明変数 x のデータを準備して、x と y の間で数理モデル y = f(x) を構築し、モデルに基づいて x の値から y の値を予測したり、y の値が目標値になるような x の値を設計したりします。モデルで予測するとき...
タイトルとURLをコピーしました