[無料公開] 「化学のためのPythonによるデータ解析・機械学習入門(改訂2版)」の“改訂版の発行にあたって”、詳細な目次、第8章の一部

2023 年 8 月 30 日に、金子弘昌著の「化学のためのPythonによるデータ解析・機械学習入門(改訂2版)」が出版されました。

 

オーム社: https://www.ohmsha.co.jp/book/9784274230929/

Amazon: https://www.amazon.co.jp/dp/4274230929/

 

こちらは、以前に出版した書籍 「化学のための Pythonによるデータ解析・機械学習入門」 の改訂版です。第1版の売れ行きが上々とのことで、オーム社の方から改訂版のお話をいただき、執筆させていただきました。化学・化学工学の分野におけるデータ解析・機械学習の昨今の情勢や Datachemical LAB の盛況を鑑みまして、第1版から以下の点を主に追記・修正いたしました。

 

  • 第8章「Datachemical LAB を用いた化学・化学工学のデータ解析・機械学習」の追加
  • 4.1.10項「ダブルクロスバリデーション(Double cross・validation : DCV)」の追加
  • 全体の内容やコードを最新版に修正

 

ただいずれにせよ、データ解析・機械学習や Python の初学者向けの本であることに変わりはありません。化学や化学工学におけるデータを活用したい方、もしくはすでにデータ活用をはじめつつあり、さらにレベルの高い活用をしたい方に、ぜひオススメの本です。

ここでは本書の“改訂版の発行にあたって”、第8章の詳細な目次および内容の一部を無料公開します。これらの無料公開をご快諾いただきましたオーム社の皆さまに感謝申し上げます。なお、無料公開として他にも、以下のページで “はじめに” と目次の詳細をご覧いただけます。なおサンプルプログラムの URL はこれまでと全く同じです (以下のページにリンクがあります)。

[無料公開] 「化学のためのPythonによるデータ解析・機械学習入門」 の “はじめに” と目次の詳細
こちらの書籍には改訂2版がございます。改訂2版でも無料公開の部分の内容は変わらない一方で、一章分+α を改訂2版では追記しておりますので、以下で興味を持っていただけましたら、改訂2版の購入をオススメいたします。2019 年 10 月 23 ...

 

本書をご購入するときの参考になれば幸いです。それでは、よろしくお願いいたします。

改訂2版の発行にあたって

本書『化学のためのPythonによるデータ解析・機械学習入門』の第1版が刊行されてからおよそ4年が経ちました.コロナ禍も経て,さまざまな業界でデジタルトランスフォーメーション(DX)が推進され,化学や化学工学の研究・開発の現場も例外ではなく,DX化が大きく進みました.また,画像生成・音楽生成・チャット等における人工知能の活躍もあり,化学や化学工学の分野におけるデータ解析および機械学習の応用に,刊行当初よりさらに大きな注目が集まるようになりました.しかし,化学や化学工学の分野では,一般的な画像・音楽・文章などと同じようには,必要なデータが大量かつ手軽に入手できるわけではありません.基本的に少数の実験データをもとにしてデータ解析・機械学習をする必要があります.データ数が小さい場合,大量のデータを扱う場合より注意深くデータ解析・機械学習をしなければ,一見正しそうでも誤った結論を導いてしまい,データから嘘をつくことになってしまいます.より慎重な対応が求められます.そこで,このような最新の情勢を考慮して,本書第2版の執筆に取り組みました.Pythonのコードを改訂するだけでなく,少数の実験データを扱う場合に有効な手法を追加したり,少数のデータからでも嘘をつかずにデータ解析・機械学習ができるウェブサービス“Datachemical LAB”に関する新たな章を追加したりするなど,内容を充実させました.今回の改訂により,ますます多くの方に本書を読んでいただければ幸いです.

最後に,第1版の企画時からさまざまな有益なアドバイスをくださり,また第2版の企画を提案した際も快諾してくださったオーム社編集局に,この場を借りてお礼申し上げます.

 

2023年7月

金子 弘昌

 

追加した8章の詳細な目次

第8章 Datachemical LABを用いた化学・化学工学のデータ解析・機械学習

8.1 Datachemical LAB

8.1.1 Datachemical LAB で実施可能な主なタスク

8.1.2 Datachemical LAB で実施可能なデータの図示

8.1.3 Datachemical LAB の可視化手法

8.1.4 Datachemical LAB の回帰分析手法

8.1.5 Datachemical LAB のクラス分類手法

8.1.6 Datachemical LABのAD設定手法, 化学構造の数値化・化学構造の生成

8.1.7 Datachemical LAB のソフトセンサー構築手法

8.1.8 Datachemical LAB の異常検出手法

8.1.9 Datachemical LAB の仮想サンプル生成

8.1.10 実験計画法

8.1.11 ベイズ最適化

8.1.12 特徴量選択

8.1.13 特徴量変換

8.1.14 欠損値補完

8.1.15 混合物の特徴量化

8.1.16 直接的逆解析

8.2 材料設計

8.3 分子設計

8.3.1 沸点

8.3.2 薬理活性(クラス分類)

8.4 適応型ソフトセンサー

8.5 Datachemical LAB による材料設計・分子設計・プロセス設計・プロセス管理

 

 

第8章 Datachemical LABを用いた化学・化学工学のデータ解析・機械学習

8.1 Datachemical LAB

本書ではここまで,Pythonプログラムによる化学および化学工学のデータ解析・機械学習について説明してきました.このようなアプローチではプログラミングが不可欠であり,プログラミングにかかる時間と労力が課題となります.しかし近年,プログラミングなしでデータ解析・機械学習ができるクラウドサービスDatachemical LAB85が登場し,ウェブブラウザ(Google Chrome,Safari,Microsoft Edge,Mozilla Firefoxなど)上で直感的な操作のみで化学および化学工学のデータ解析・機械学習が可能になっています.このDatachemical LABを使うことで,実験科学者自身の手でデータ解析・機械学習に基づいて分子・材料・プロセスを設計することが容易になりました.本節ではDatachemical LABの内容と機能について説明します (本書で解説するのは2023年7月現在のDatachemical LABであり,今後も手法や機能が更新される可能性があります).

8.1.1  Datachemical LABで実施可能な主なタスク

Datachemical LABでは主に以下のタスクを実施できます.

  • 現状のデータセットを解析する最適な回帰モデル・クラス分類モデルの構築
  • 複数の目的変数yを同時に考慮したモデルの構築
  • ダブルクロスバリデーション(DCV)(1.10項参照)による少ないサンプルのデータセットの解析
  • 構築されたモデルに基づいたモデルの適用範囲(Applicability Domain:AD)(第5章参照)を考慮した分子設計・材料設計・プロセス設計
  • ベイズ最適化86)による外挿探索および設計
  • 仮想的なサンプル(実験条件,合成条件,製造条件,評価条件,プロセス条件など)の自動生成
  • 化学構造の自動生成
  • 化学構造の数値化(分子記述子,フィンガープリントの計算)
  • 効果的な機械学習が可能になるような最初の実験条件を決める実験計画法
  • BOに基づく適応的実験計画法
  • モデルの直接的逆解析法87)に基づく適応的実験計画法
  • データセットにおける欠損値の自動的補完
  • データセットの低次元化・見える化・可視化
  • 特徴量設計,特徴量変換,特徴量選択
  • 高分子や合金等の材料に対する特徴量の計算
  • ソフトセンサーによるリアルタイム予測
  • モデルの予測精度を維持する適応的ソフトセンサー
  • プロセスのモニタリングおよび異常検出

 

以上です。

質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。

タイトルとURLをコピーしました