elsur.jpn.org >

« 読了:「現代中国女工哀史」 | メイン | 読了:「Pet」ほか »

2010年5月 6日 (木)

Magidson, J., & Vermunt, J.K. (2002) Latent class models for clustering: A comparison with k-means. Canadian Journal of Marketing Research, 20, 22-44.
著者はLatentGoldの開発者。潜在クラス分析とk-means法のパフォーマンスを比較した論文。2クラスを想定し,独立な正規乱数で人工データ(量的2変数)をクラス別に生成しておいて,両方の手法で分類する。潜在クラス分析のほうが全然良かったです,とのこと。
 よくわからん。局所独立で,正規性があって,クラス内分散が等しい人工データに対して,局所独立性と正規性と等分散性を仮定したモデルベース分析が良いパフォーマンスを示すのは当然ではなかろうか。むしろ問題は,モデルの想定が正しくないときのパフォーマンスだと思うのだが。。。ま,2手法の違いを要約してくれている箇所は助かるので,良しとしよう。

正直言ってちょっと疲れてきた... どこかで休日をつくりたい。

論文:データ解析(-2014) - 読了:Magidson&Vermunt(2002) 潜在クラスモデルでクラスタリング