One-Class Support Vector Machine (OCSVM) で外れ値・外れサンプルを検出したりデータ密度を推定したりしよう!

今回は、One-Class Support Vector Machine (OCSVM) についてです。OCSVM は SVM を領域推定問題に応用した手法であり、外れ値・外れサンプルを検出できたり、データ密度を推定できたりします。データ密度により、モデルの適用範囲・適用領域を設定することも可能です。

モデルを作るのにサンプル数はいくつ必要か?に対する回答~モデルの適用範囲・モデルの適用領域~
統計だったり機械学習だったりニューラルネットワークだったり、データを使ったモデルの開発をしていますと、 いくつサンプルがあったらモデルはできますか? ってよく聞かれます。今回はこの質問に答えながら、モデルの適用範囲・モデルの適用領域について...

そんなOCSVMについて、pdfとパワーポイントの資料を作成しました。OCSVM の具体例や計算方法について説明されています。pdfもスライドも自由にご利用ください

 

pdfファイルはこちらから、パワーポイント(pptx)ファイルはこちらからダウンロードできます。

興味のある方はぜひ参考にしていただき、どこかで使いたい方は遠慮なくご利用ください。

OCSVM の概要

  • サポートベクターマシン (Support Vector Machine, SVM) を
    領域推定問題に応用した手法
  • SVM では2つのクラス (1のクラス・-1のクラス) があったが、OCSVM では1クラスだけ (すべてのサンプルが同じクラス)
  • データ密度を連続的に推定できる
  • カーネルトリックにより非線形に拡張可能
  • 外れ値検出・外れサンプル検出や、モデルの適用範囲の設定に応用される
外れ値検出 (Outlier Detection) もしくは 外れサンプル検出 (Outlier Sample Detection) ~他の値・サンプルと大きく異なる値・サンプルを見つけよう!~
今回は、外れ値検出 (Outlier Detection) もしくは 外れサンプル検出 (Outlier Sample Detection) についてです。他の値と大きく異なる値を見つけたり、他のサンプルと大きく異なるサンプルを見つけたりす...
モデルを作るのにサンプル数はいくつ必要か?に対する回答~モデルの適用範囲・モデルの適用領域~
統計だったり機械学習だったりニューラルネットワークだったり、データを使ったモデルの開発をしていますと、 いくつサンプルがあったらモデルはできますか? ってよく聞かれます。今回はこの質問に答えながら、モデルの適用範囲・モデルの適用領域について...

 

スライドのタイトル

  • One-Class SVM (OCSVM) とは?
  • SVMのおさらい:マージン最大化
  • SVMのおさらい:サポートベクター
  • SVMのおさらい:スラック変数の導入
  • SVMのおさらい:最小化する関数
  • OCSVMの考え方
  • 原点からの距離で大丈夫?
  • 高次元空間で考える
  • マージンの最大化
  • 原点付近にサンプルがあるときは?
  • 一緒に最小化
  • 重み w と b を求める
  • 偏微分して0
  • 二次計画問題
  • 直線の式を求める
  • G の変形
  • カーネル関数の例
  • OCSVMのまとめ
  • OCSVMの使い方
  • ν, γ の決め方

 

以上です。

質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。

タイトルとURLをコピーしました