金子弘昌, 「化学のための Pythonによるデータ解析・機械学習入門」, オーム社, 2019
オーム社: https://www.ohmsha.co.jp/book/9784274224416/
Amazon: https://www.amazon.co.jp/dp/4274224414
自分の本の紹介で恐縮です。ただ、データ解析や機械学習による分子設計、材料設計、プロセス設計、プロセス管理・制御をしたい、すなわちケモインフォマティクス、マテリアルズインフォマティクス、プロセスインフォマティクスを実践したい方に、本当にオススメする本です。実際、データ化学工学研究室 (金子研) では一人一冊配布していますし、講義のテキストにもしています。そのため、ここでも紹介します。
紹介としては、すでに “はじめに” と “目次の詳細” を無料公開していますので、こちらを読んでいただくのがよいと思います。

[無料公開] 「化学のための Pythonによるデータ解析・機械学習入門」 の “はじめに” と目次の詳細
2019 年 10 月 23 日に、金子弘昌著の「化学のための Pythonによるデータ解析・機械学習入門」が発売になりました。
オーム社:
(Amazon で在庫が切れていても、他では在庫があるようです。上のオーム社のウェブサイトに...
「化学のための Pythonによるデータ解析・機械学習入門」 では、データ解析・機械学習に関連する内容として、主に以下のことを学べます。
- Pythonの基礎、データセットの読み込み・保存
- データの図示、ヒストグラム、箱ひげ図、散布図、相関行列
- 多変量データ、データの前処理、主成分分析 (Principal Component Analysis, PCA)、階層的クラスタリング、t-distributed Stochastic Neighbor Embedding (t-SNE)
- 回帰分析、最小二乗法による線形重回帰分析、回帰モデルの推定性能の評価、オーバーフィッティング(overfitting)、多重共線性(multicollinearity)、主成分回帰 (Principal Component Regression, PCR)、クロスバリデーション (Cross Validation, CV)、ハイパーパラメータ (hyperparameter)、部分的最小二乗法 (Partial Least Squares, PLS)、サポートベクター回帰 (Support Vector Regression, SVR)
- クラス分類、k 近傍法 (k-Nearst Neighbor algorithm, k-NN)、サポートベクターマシン (Support Vector Machine, SVM)、決定木 (Decision Tree, DT)、ランダムフォレスト (Random Forest, RF)
- モデルの適用範囲、データ密度、One-Class Support Vector Machine (OCSVM)
- アンサンブル学習法
- 材料設計・分子設計・医薬品設計、樹脂材料 (高分子材料) の設計、超伝導体材料の設計
- 化学構造の表現方法、Simplified Molecular Input Line Entry System (SMILES)、MOL file、化合物群の扱い、化学構造の数値化、化学構造の生成
- 時系列データの解析、推定制御・ソフトセンサー、モデルの劣化、適応型ソフトセンサー
- 化学プラントのプロセス管理(異常検出・異常診断)、異常検出モデル、異常に関係するプロセス変数の診断
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。