化学工学会の会誌で、Python でデータ解析・機械学習をおこなうための連載が始まりました。
〔連載〕プログラミング未経験者のためのデータ解析・機械学習
が化学工学会の会誌でスタートしました!
1. 本連載のねらい・Jupyter Notebookの使い方
2. Pythonの基礎・データセットの扱い
3. データセットの特徴の把握(ヒストグラム・基礎統計量・散布図・相関係数)https://t.co/T7T9nK0Dct
— 金子弘昌/Hiromasa Kaneko (@hirokaneko226) July 31, 2019
全12回の予定です。
すべてサンプルプログラム (サンプルNotebook) 付きですので、取り組みやすいかと思います!
— 金子弘昌/Hiromasa Kaneko (@hirokaneko226) July 31, 2019
今後の予定です。
4. データの前処理と可視化(PCA)
5. 階層的クラスタリング
6. クラス分類(k-NN)
7. 回帰分析(k-NN, OLS)
8. PLS
9. ハイパーパラメータの最適化
10. モデルの適用範囲
11. (適応的)実験計画法
12. 化学構造の扱い連載で解説して、サンプルコードで実習といった形式で進みます。
— 金子弘昌/Hiromasa Kaneko (@hirokaneko226) July 31, 2019
ちなみに全 12 回分の原稿は、今年度の金子研四年生の新人研修にて使用しており、そのときの学生からのフィードバックも盛り込んだものになっております。
— 金子弘昌/Hiromasa Kaneko (@hirokaneko226) July 31, 2019
想定している読者は、
- プログラミングをやったことがない
- データ解析・機械学習を取り組んでみたい
といった方々です。
プログラミング言語として Python というものを用います。Python について知らない方々にも読んでいただけるよう、Python の説明はもちろんのこと、ソフトウェアのインストールの仕方や、起動の仕方、使い方から説明しています。プログラミングを少しでもやったことある方にとっては、第 1 回目はいらないかもしれません。。。
プログラミングをやったことなければ Python もまったく知らない、金子研配属になった大学 3 年生 10 人に、実際に連載 12 回分に取り組んでもらいました。全員、滞りなく進めることができ、そこで取り組んだ結果としてのコメントなどのフィードバックも、連載に反映させています。
化学工学会の会員の方が読むことができます。興味のある方はぜひよろしくお願いいたします。
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。