「Pythonで気軽に化学・化学工学」 Python プログラミングを学びながら化学・化学工学のデータ解析・機械学習をしたい方へ

シェアする

金子弘昌, 「Pythonで気軽に化学・化学工学」, 丸善, 2021

丸善: https://www.maruzen-publishing.co.jp/item/?book_no=304108

Amazon: https://www.amazon.co.jp/dp/4621306154

Amazon(Kindle): https://www.amazon.co.jp/dp/B096TGPDYP/

自分の本の紹介で恐縮です。ただ、データ解析や機械学習による分子設計、材料設計、プロセス設計、プロセス管理・制御をしたい、すなわちケモインフォマティクス、マテリアルズインフォマティクス、プロセスインフォマティクスを実践したい方に、本当にオススメする本です。Python についても、プログラムの一行一行説明があるため、プログラミングも一緒に学べます。実際、データ化学工学研究室 (金子研) では、配属された学生に一人一冊配布して、新人研修の最初として取り組んでいます。また、講義のテキストにもしています。

紹介としては、すでに “まえがき”、目次の詳細、第1・2・3章 を無料公開していますので、こちらを読んでいただくのがよいと思います。

[無料公開] 「Pythonで気軽に化学・化学工学」 の “まえがき”、目次の詳細、第1・2・3章
2021 年 5 月 1 日に、金子弘昌著の「Pythonで気軽に化学・化学工学」が出版されました。 丸善: Amaz...

「Pythonで気軽に化学・化学工学」 では、データ解析・機械学習に関連する内容として、主に以下のことを学べます。

  • Python、Anaconda のインストール、Jupyter Notebook の使い方、キーボードショートカット
  • Pythonプログラミングの基礎
  • データセットの読み込み、データセットの中身の確認、データセットの保存
  • ヒストグラムによるデータの分布の確認、基礎統計量の計算、散布図による特徴量間の関係の確認、相関係数による特徴量間の関係の強さの確認
  • 特徴量の標準化 (オートスケーリング)、ばらつきの小さい特徴量の削除、類似した特徴量の組における一方の特徴量の削除
  • データセットの見える化(可視化)、主成分分析、t-distributed Stochastic Neighbor Embedding (t-SNE)
  • クラスタリング、階層的クラスタリングの基礎
  • クラス分類(クラス分類とクラスタリングとの違い,教師あり学習と教師なし学習)、k 近傍法 (k-Nearst Neighbor algorithm, k-NN)、サポートベクターマシン (Support Vector Machine, SVM)、決定木 (Decision Tree, DT)、ランダムフォレスト (Random Forest, RF)、クラス分類モデルの推定性能の評価
  • 回帰分析、k-NN、 最小二乗法による回帰分析、モデルの推定性能を低下させる要因とその解決手法、オーバーフィッティング、部分的最小二乗法 (Partial Least Squares, PLS)、さまざまな解析の自動化・効率化、外部バリデーションと内部バリデーション、ハイパーパラメータ、サポートベクター回帰 (Support Vector Regression, SVR)、決定木、ランダムフォレスト
  • ダブルクロスバリデーション
  • モデルの適用範囲、データ密度、アンサンブル学習法、One-Class Support Vector Machine (OCSVM)
  • モデルの逆解析、仮想サンプルの生成、
  • 実験計画法、応答曲面法、適応的実験計画法
  • 化学構造の扱い、RDKit のインストール、化学構造の表現方法、Simplified Molecular Input Line Entry System (SMILES)、Molfile、化学構造の数値化

以上です。

質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。

シェアする

フォローする