データ解析や機械学習でできる解釈は、あくまで「モデル」の解釈

分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と材料や製品の物性・活性・特性などの目的変数 y との間で、データセットを用いて数理モデル y =...

仕組みで解決する、人が解決する

マクドナルドでハンバーガーを注文すると、どこの店舗でも、どの店員でも同じようにオペレーションされ、支払いやハンバーガーの受け取りをすることができます。一方で、(毎年出るのではなく) 新しいハンバーガーの開発は、限られた人の中で行われています...

Datachemical LABで複雑な実験系・プロセスにも対応した仮想サンプルの生成ができるようになりました

継続的にDatachemical LABの機能を充実させています。今回は仮想サンプル生成において、新たな機能が追加されました。プレスリリースはこちらです。 材料設計やプロセス設計において、実験条件・合成条件・評価条件・プロセス条件などの特徴...

データセットを扱うときはサンプル一つ一つに気を配ることが重要です!

分子設計・材料設計・プロセス設計において、分子記述子・実験条件・合成条件・評価条件・プロセス条件などの特徴量 x と分子や材料の物性・活性・特性などの目的変数 y との間で、データセットを用いて数理モデル y = f(x) を構築します。構...

特徴量として実測値ではなく推定値を用いたほうがモデルの予測精度が高くなるときってありますよね

分子設計・材料設計・プロセス設計において、分子・材料・プロセスの特徴量と x と分子や材料の物性・活性・特性 y との間で、データセットを用いて数理モデル y = f(x) を構築して、モデルを用いて x の値から y の値を予測したり、y...

一つのサンプルに対して実験結果が複数あるときのアンサンブル学習

分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・合成条件・プロセス条件・プロセス変数 x と分子や材料の物性・活性 y との間で数理モデル y = f(x) を構築し、構築されたモデルを用いて x から y を予測したり...

リザバーコピューティングの本質とは

リザバーコピューティングについて調査していました。こちらの本を読んだり、 いくつか論文を読んだりです。 リザバーコンピューティングとは、例えばリカレントニューラルネットワーク (Recurrent Neural Network, RNN) ...

任意の回帰分析手法で変数重要度(特徴量重要度)を計算する機能をDCEKitに搭載しました![v2.10.1]~Cross-validated Permutation Feature Importance(CVPFI)~

どの回帰分析手法でも変数重要度 (特徴量重要度) を計算する機能を DCEKit に搭載しました!重要度が 0 を有意に超えるようであれば、その説明変数 x はモデルの予測精度に貢献しているといえます。しかも、x の間に相関関係があっても、...

[無料公開] 「化学・化学工学のための実践データサイエンス―Pythonによるデータ解析・機械学習―」 の “まえがき”、目次、第1・2章

2022 年 10 月 5 日に、金子弘昌著の「化学・化学工学のための実践データサイエンス―Pythonによるデータ解析・機械学習―」が出版されました。 朝倉書店: Amazon: これまで他に、三冊の本 「化学のための Pythonによる...

Cross-validated Permutation Feature Importance(CVPFI)~任意の回帰分析手法で、説明変数間の相関関係を考慮しながら安定的に変数重要度(特徴量重要度)を計算する手法[金子研論文]

金子研の論文が Analytical Science Advances に掲載されましたので、ご紹介します。タイトルは Cross-validated permutation feature importance considering c...
タイトルとURLをコピーしました