« 読了:「忠誠と反逆」 | メイン | 読了:Vermunt&Magidson(2002) 潜在クラスでクラスタ分析 »
2010年4月16日 (金)
McCutcheon, A.L. (2002) Basic Concepts and Procedures in Single- and Multiple-Group Latent Class Analysis. in Hagenaars & McCutcheon (eds) "Applied Latent Class Analysis," Cambridge Univ. Press. Chapter 2.
潜在クラスモデル論文集の2章。1章はえらい人のありがたい章という感じで,こっちがほんとのイントロダクションに相当するようだ。潜在クラスモデルの基礎的概念についてわかりやすく説明している。推定アルゴリズム(EMとニュートン・ラフソン)や適合度指標についても触れている。途中でめんどくさくなって斜め読みしちゃったけど。
潜在クラス変数をX, そのカテゴリカルな指標をA,Bとしたとき,潜在クラスモデルを
$P(A=i \ and \ B=j \ and \ X=t)$
$= P(X=t) P(A=i|X=t) P(B=j|X=t)$
というふうに,条件つき確率の積として定式化している本がある。また,2次までしか交互作用がない対数線型モデルとして,
$ln(f^{ABX}_{ijt}) = \lambda + \lambda^X_t + \lambda^A_i + \lambda^B_j + \lambda^{AX}_{it} + \lambda^{BX}_{jt}$
というふうに定式化しているものもある。俺はどっちかというと後者のほうがしっくりくるのだが,A*Bの二元クロス表から考えると,前者のほうが直観的にわかりやすいだろう。とにかく,本や論文によって定式化の方法がちがうので,いささか混乱していた。
しかしこの論文によると,両方の定式化ができるというのが潜在クラスモデルの価値を高めているとのこと。どっちの定式化でも同じ事なんだけど,一方では簡単に記述しやすい制約が,他方では記述しにくかったりするのだそうだ。その例として挙げられているのが,ある潜在クラスの下でのある指標の条件つき確率が0か1だ,という決定論的な制約。確率による定式化なら,$P(A=1|X=1) =1$ というふうに簡単に書けるが,対数線型モデルだと$\exp(\lambda^A_i + \lambda^{AX}_{it})=0$ ということになり,係数が負の無限大になってしまう。なるほどねえ... もっとも,そんな制約がいつ必要になるのか想像がつかないが。
ほんとはこんな論文を読んでいる場合ではない。潜在クラス分析関係で目を通したい資料は山積みになっているし,ほかにも「読みます!」と約束した資料があるし,そもそも講義の準備をせなばならん。ま・ず・い。。。
論文:データ解析(-2014) - 読了:McCutcheon(2002) 潜在クラスモデル入門