機械学習・データ解析について、これまで 10 回以上 Python を用いたハンズオンセミナーをしたことがあります。ハンズオンセミナーとは体験学習のことです。たとえば私が実施したことでいえば、機械学習・データ解析に関する勉強をするだけでなく、勉強した内容について実際にプログラミングして、その場でデータ解析までします。勉強してそのままにしてしまうと、時間の経過とともに内容を忘れてしまいますが、実際に手を動かしてプログラミングして実行までしているため、より自分の身につくわけですね。資料だけでなく実行したプログラムも手元に残るので、勉強した内容をあとで復習したり、機械学習・データ解析を実際に現場で活用したりするのが簡単です。
基本的には、二日にわたって10時間かけてハンズオンセミナーをします。ここでは、10時間のハンズオンセミナーで機械学習・データ解析・Pythonについてどれくらいのことができるようになるのか説明します。もし社内やセミナー等で機械学習・データ解析・Pythonに関するハンズオンセミナーを希望するときは、参考にしてください。
ちなみに、予備知識は高校卒業程度の数学知識であり、必要な技術は ある程度パソコンの操作に慣れていること、です。Pythonやプログラミングの経験は必要ありません。
ハンズオンセミナーで実施した内容は以下のとおりです。
1.Pythonの基礎
- Jupyter Notebookの使い方
- データ解析のためのPythonプログラミング
- データの読み込み・確認・保存
2.データの前処理・可視化 (見える化)
- サンプル・変数の削除
- データセットの分割
- 標準化 (オートスケーリング)
- 主成分分析 (Principal Component Analysis, PCA)
3. 回帰分析・クラス分類
- 線形判別分析 (Linear Discriminant Analysis、LDA)
- サポートベクターマシン (Support Vector Machine、SVM)
- 最小二乗法による線形重回帰分析
- 部分的最小二乗回帰 (Partial Least Squares Regression, PLS)
- リッジ回帰
- Least Absolute Shrinkage and Selection Operator (LASSO)
- Elastic net
- サポートベクター回帰 (Support Vector Regression、SVR)
- 決定木
- モデルの予測性能の検証
- ダブルクロスバリデーション
- 使い分けと効果的な活用のコツ
4. アンサンブル学習
- ランダムフォレスト
- バギング
- Adaptive boosting (Adaboost)
5. その他
- さらに深みを目指すために
- 応用事例の紹介 (ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクス)
- 質疑応答
もちろん、上の内容をしぼって短時間にすることも、長時間にしてより内容を拡充することも可能です。社内やセミナー等で機械学習・データ解析・Pythonに関するハンズオンセミナーを希望するときは、ご相談ください。
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。