混合ガウスモデル (Gaussian Mixture Model, GMM)~クラスタリングするだけでなく、データセットの確率密度分布を得るにも重宝します~

シェアする

クラスタリングについては、階層的クラスタリングと k-means クラスタリングをやりました。

階層的クラスタリング(クラスター分析)、近いクラスターを結合していく
応化先生と生田さんが、階層的クラスタリング(クラスター分析)について話しています。 応化:今日は階層的クラスタリングの話をしま...
k平均法 (k-means clustering) 非階層的クラスタリング
応化先生と生田さんが k平均法 (k-means clustering) について話しています。 応化:今回は、k平均法 (k...

今回は、混合ガウスモデル (Gaussian Mixture Model, GMM) というクラスタリングの手法です。GMM を使うことで、データセットをクラスターごとに分けられるだけでなく、データセットの確率密度分布を得ることができます。この分布を使えば、新たにサンプリングできたり、回帰分析やクラス分類の逆解析に応用できたりするわけです。

そんな有用な GMM について、pdfとパワーポイントの資料を作成しました。GMM の具体例や計算方法について説明されています。pdfもスライドも自由にご利用ください

pdfファイルはこちらから、パワーポイント(pptx)ファイルはこちらからダウンロードできます。

興味のある方はぜひ参考にしていただき、どこかで使いたい方は遠慮なくご利用ください。

GMM の概要

  • クラスタリング手法の一つ
  • 与えられたデータセットを、複数の正規分布の重ね合わせで表現する
  • 確率密度関数が得られる (確率分布として表現できる)
  • サンプルごとに、各クラスターに所属する確率が得られる
  • クラスター数を自動的に決められる

スライドのタイトル

  • GMM とは?
  • どんなときに GMM を使うか?
  • 正規分布 (ガウス分布, Gaussian distribution)
  • 正規分布の例
  • 多変量正規分布
  • 多変量正規分布の例 2変数
  • (多変量)正規分布の重ね合わせとは? 例
  • 混合正規分布 (混合ガウス分布)
  • 混合正規分布 (混合ガウス分布) 式
  • GMM の方針
  • 実際に GMM をやってみる
  • 各サンプルがどのクラスターになるか考える 1/3
  • 各サンプルがどのクラスターになるか考える 2/3
  • 各サンプルがどのクラスターになるか考える 3/3
  • 実際にクラスターを割り振る
  • クラスター数をどう決めるか?
  • ベイズ情報量規準 (BIC) を計算してみた
  • [補足] EM アルゴリズム  対数尤度関数
  • [補足] EM アルゴリズム  最大 → 極大
  • [補足] EM アルゴリズム  μで微分
  • [補足] EM アルゴリズム  負担率
  • [補足] EM アルゴリズム  μの計算
  • [補足] EM アルゴリズム  Σ の計算
  • [補足] EM アルゴリズム  π の計算
  • [補足] EM アルゴリズム  π
  • [補足] EM アルゴリズム  まとめ
  • 参考文献

以上です。

質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。

シェアする

フォローする