いろいろな回帰モデル・クラス分類モデルを構築したり、モデルの中のハイパーパラメータ (PLSの成分数など) を決めたりするとき、モデルを評価・比較しなければなりません。そのためのモデルの検証 (model validation) の方法について、pdfとパワーポイントの資料を作成しました。
データセットの説明からはじまり、モデル評価・比較するための指標・ハイパーパラメータの決め方・データの選び方などについて説明されています。pdfもスライドも自由にご利用ください。
pdfファイルはこちらから、パワーポイント(pptx)ファイルはこちらからダウンロードできます。
興味のある方はぜひ参考にしていただき、どこかで使いたい方は遠慮なくご利用ください。
スライドのタイトル
- “良い”回帰モデル・クラス分類モデルとは何か?
- データセットの呼び方
- 比較指標
- 回帰分析 決定係数 r2
- 回帰分析 RMSE
- 回帰分析 MAE
- クラス分類 混同行列・正解率・精度・検出率
- クラス分類 Kappa係数
- モデルの評価・比較 ハイパーパラメータの決定
- どのようなハイパーパラメータを用いるか?
- クロスバリデーション
- クロスバリデーションの補足
- どのようにデータセットを分けるか?
- Y-randomization (Yランダマイゼイション)
以上です。
質問・コメントがありましたら、twitter・facebook・メールなどを通して教えていただけるとうれしいです。