elsur.jpn.org >

« 読了:「ロミオとジュリエット」 | メイン | 読了:「エデナの世界」「ZUKKA ZUKA」「闇金ウシジマくん」 »

2011年11月30日 (水)

 大した仕事をしているわけでもないのに,なんだかんだとバタバタしていて,読みたいものもろくに読めないし,読んでも記録する暇がない,という日々であった。情けないことだ。
 久々に面白い論文を読んだので,これを機に,ちゃんと一々記録するように心がけたいと思う。

Muthen, B., Asparouhov, T. (in press) Bayesian SEM: A more flexible representation of substantive theory. Psychological Methods.
 SEM方面の神様Muthen先生による、SEMのパラメータ推定をベイズ流にやるとこんなに素敵なことがあるよ、Mplusに実装したから使ってね、という論文。数理技術的な理屈はパスして、ユーザにとっての利点の話に徹している。
 子のたまわく、ベイズ流アプローチの利点は4つ。(1)パラメータ推定やモデル適合についてもっといろいろわかります。(2)小標本でも優れたパフォーマンス。(3)計算も楽。(4)これまでに作れなかったモデルが作れます(ランダム変化点モデルとか)。
 論文中の説明はCFAが中心。常識的には、CFAモデルは因子パターン行列にある程度ゼロを埋めないと識別できないが、ベイズ流にいえばこれはその箇所に平均ゼロ分散ゼロの事前分布を与えることに相当している。で,かわりに多少の分散を持つ事前分布を与えたってMCMCは収束する。こうして,分析者の知識に応じてゼロ埋めなしのCFAモデルが推定できる。先生はこういうのをBSEMと呼んでおられる。EFAとCFAのあいだを埋めるような使い方ができるわけだ。
 残差相関もBSEMでモデリングできる。(1)残差共分散行列を対角じゃない行列と対角行列に分解し、前者について逆ウィシャート事前分布を与えるやりかた、(2)残差共分散行列そのものに逆ウィシャート事前分布を与えるやりかた、(3)個々の残差共分散に正規事前分布を与えるやりかた、がある由。
 後半は実データとシミュレーションによるデモ。面白かったのは... 各因子が5つの指標を負荷0.8で持つ単純構造の3因子CFAモデルを考え、n=100のデータをつくり、正しいCFAモデルを当てはめて推定する。ML推定での尤度比検定でモデルが棄却されちゃう確率は? 有意水準5%ならまあ5%くらいだろう、nが大きいとカイ二乗値はデカくなりすぎるというけど、まあn=100なら大丈夫かな... と思ったのだが、この論文によれば実に17%である由。真の因子負荷がほんとに単純構造ならば、この確率はむしろnが大きいときに5%に近づく(なるほど)。なおベイズ流アプローチ(無情報事前分布を使用)ならば、nに関わらず3%くらい。
 では、不幸にして真の構造にcross-loadingがあった場合はどうか。負荷0.1を持つ指標が3つあるとき、モデルが棄却されてしまう確率は、n=100で23%, n=400だと実に46%。たった0.1の負荷ごときで、こいつはちょっと厳しすぎるんじゃないですかね、という話である。ベイズ流アプローチならば、それぞれ6%、26%とのこと。

論文:データ解析(-2014) - 読了:Muthen&Asparouhov(in press) ベイジアンSEM