今回は、モデルの適用範囲・モデルの適用領域 (Applicability Domain, AD) についてです。AD は回帰モデル・クラス分類モデルが本来の性能を発揮できるデータ領域のことです。回帰モデル・クラス分類モデルを使うとき必須になります。
そんな AD について、pdfとパワーポイントの資料を作成しました。AD の具体例や計算方法について説明されています。pdfもスライドも自由にご利用ください。
pdfファイルはこちらから、パワーポイント(pptx)ファイルはこちらからダウンロードできます。
興味のある方はぜひ参考にしていただき、どこかで使いたい方は遠慮なくご利用ください。
AD の概要
- モデルが十分な性能を発揮できるデータ領域
- AD の設定方法
- トレーニングデータの範囲
- トレーニングデータの中心からの距離
- データ密度
- アンサンブル学習ベイズの定理を利用
- モデルとの距離 (Distance to Model, DM) によって AD の広さを定量的にすることで、推定誤差を見積もることができる
- クラス分類でアンサンブル学習により AD を設定するときは注意する
スライドのタイトル
- モデルの適用範囲 (AD) とは?
- どんな X の値でもモデルに入力してよいのか?
- モデルの適用範囲・適用領域のイメージ
- モデルの適用範囲・適用領域のイメージ
- モデルの適用範囲・適用領域
- AD の設定
- トレーニングデータの範囲
- トレーニングデータの中心からの距離
- データ密度
- データ密度
- アンサンブル学習
- モデルとの距離 (Distance to Model)
- 回帰モデルの予測誤差(信頼性)の推定
- 注意!
- 数値シミュレーションデータで確認
- すべてのサブモデルで分類結果が一致した領域
- データ密度も使いましょう!
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。