クラスタリングについては、階層的クラスタリングと k-means クラスタリングをやりました。
階層的クラスタリング(クラスター分析)、近いクラスターを結合していく
応化先生と生田さんが、階層的クラスタリング(クラスター分析)について話しています。 応化:今日は階層的クラスタリングの話をします。 生田:よろしくお願いします。クラスタリングって、クラス分類と名前の似ているアレですよね。 応化:そうですね。...
k平均法 (k-means clustering) 非階層的クラスタリング
応化先生と生田さんが k平均法 (k-means clustering) について話しています。 応化:今回は、k平均法 (k-means clustering) についてです。クラスタリングですね。 生田:階層的なクラスタリングですか? ...
今回は、混合ガウスモデル (Gaussian Mixture Model, GMM) というクラスタリングの手法です。GMM を使うことで、データセットをクラスターごとに分けられるだけでなく、データセットの確率密度分布を得ることができます。この分布を使えば、新たにサンプリングできたり、回帰分析やクラス分類の逆解析に応用できたりするわけです。
そんな有用な GMM について、pdfとパワーポイントの資料を作成しました。GMM の具体例や計算方法について説明されています。pdfもスライドも自由にご利用ください。
pdfファイルはこちらから、パワーポイント(pptx)ファイルはこちらからダウンロードできます。
興味のある方はぜひ参考にしていただき、どこかで使いたい方は遠慮なくご利用ください。
GMM の概要
- クラスタリング手法の一つ
- 与えられたデータセットを、複数の正規分布の重ね合わせで表現する
- 確率密度関数が得られる (確率分布として表現できる)
- サンプルごとに、各クラスターに所属する確率が得られる
- クラスター数を自動的に決められる
スライドのタイトル
- GMM とは?
- どんなときに GMM を使うか?
- 正規分布 (ガウス分布, Gaussian distribution)
- 正規分布の例
- 多変量正規分布
- 多変量正規分布の例 2変数
- (多変量)正規分布の重ね合わせとは? 例
- 混合正規分布 (混合ガウス分布)
- 混合正規分布 (混合ガウス分布) 式
- GMM の方針
- 実際に GMM をやってみる
- 各サンプルがどのクラスターになるか考える 1/3
- 各サンプルがどのクラスターになるか考える 2/3
- 各サンプルがどのクラスターになるか考える 3/3
- 実際にクラスターを割り振る
- クラスター数をどう決めるか?
- ベイズ情報量規準 (BIC) を計算してみた
- [補足] EM アルゴリズム 対数尤度関数
- [補足] EM アルゴリズム 最大 → 極大
- [補足] EM アルゴリズム μで微分
- [補足] EM アルゴリズム 負担率
- [補足] EM アルゴリズム μの計算
- [補足] EM アルゴリズム Σ の計算
- [補足] EM アルゴリズム π の計算
- [補足] EM アルゴリズム π
- [補足] EM アルゴリズム まとめ
- [補足] 変分ベイズ法 μ, Σ の事前分布
- [補足] 変分ベイズ法 π の事前分布
- 参考文献
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。