« 読了:「白い城」 | メイン | 読了:「ヨブ記講演」「ヨブ記」「イエス・キリストは実在したのか?」 »
2014年12月 5日 (金)
Muthen, L.K., Muthen, B.O. (2009) How to use a monte carlo study to decide on sample size and determine power. Structural Equation Modeling, 9(4), 599-620.
哀れなSEMユーザのみなさんのために、Muthen導師夫妻が懇切丁寧に説明する啓蒙論文。題名のとおり、SEMのようなモデリングの際に必要なサンプルサイズはモンテカルロ・シミュレーションで決めろ、こうやって決めろ、という話である。よく言及される論文でもあるので、いちおうざっと目を通した。
例として、以下のモンテカルロ・スタディを行う。
ひとつめ、CFA。
- モデルを決める。ここでは2因子CFA、因子あたり連続指標5つ、因子間相関ありとしよう。以下、因子f1の指標をy1-y5, f2の指標をy6-y10とする。
- パラメータを決める。因子負荷$\lambda$はすべて0.8, 残差分散$\theta$はすべて0.36, 因子平均はどちらも0で分散$\Psi$はどちらも1 (例外は後述), 因子間相関0.25とする。指標の信頼性は、指標の分散のうち因子で説明できた部分の割合だから、$\lambda^2 \Psi / (\lambda^2 \Psi + \theta) = 0.64$となる。
- 反復数を決める。ここでは10000とする。
さて、ここで次の4つのバージョンをつくってみます。
- 欠損なし、正規分布。
- 欠損あり、正規分布。
- 欠損なし、非正規分布。
- 欠損あり、非正規分布。
欠損ありの場合、y5-y10は50%を欠損(MCAR)にする。非正規分布の場合、未知のクラスをふたつつくり、比率を12%と88%とする。クラス1のみ、f2の平均を15, 分散を5にする。
以下では因子間相関の検定力に注目する。測定誤差によって希薄化するので。
ふたつめ、成長モデル。
- モデルを決める。線形成長モデル、等間隔4時点で連続指標を測定(以下y1-y4)。以下の2種類をつくる。モデル1, 共変量なし。モデル2, 2値共変量がひとつあって、傾き因子と切片因子に効いている。
- パラメータを決める。切片因子の平均0, 分散$\Psi_i$は0.5, 傾き因子の平均0.2, 分散$\Psi_s$は0.1。モデル1における切片因子と傾き因子の共分散$\Psi_{is}$は0。指標の残差分散$\theta_t$はいずれも0.5。各指標のR二乗は、時間スコア$x_t = (0,1,2,3)$として次の式で計算できて
$R^2(y_t) = (\Psi_i + x^2 \Psi_s + 2x_t \Psi_{is}) / (\Psi_i + x^2 \Psi_s + 2x_t \Psi_{is} + \theta_t)$
y1から順に0.5,0.55,0.64,0.74になる。モデル2は、共変量が1となる割合を0.5、切片因子への回帰係数を0.5、切片因子の残差分散を0.25。傾き因子への回帰係数は後述、傾き因子の残差分散を0.09とする。 - 反復数を決める。ここでは10000とする。
さて、ここで次の5つのバージョンをつくってみます。
- モデル1。
- モデル2、共変量から傾き因子への回帰係数を0.2にする。
- モデル2、共変量から傾き因子への回帰係数を0.2にする。欠損あり。
- モデル2、共変量から傾き因子への回帰係数を0.1にする。
- モデル2、共変量から傾き因子への回帰係数を0.1にする。欠損あり。
欠損ありの場合、時点1から4までの欠損(MAR)を、共変量0のときに順に12%, 18%, 27%, 50%, 共変量1のときに12%, 38%, 50%, 78%とする(共変量でドロップアウトが変わる状況をシミュレーションしているのだ)。
以下では傾き因子への回帰係数の検定力に注目する。成長モデルでは傾きの群間差が問題になることが多いので。
さて、サンプルサイズをどうやって決めるか。以下の3つの基準を満たすサンプルサイズを探す。
- 全てのパラメータについて、パラメータとSEのバイアスが10%を超えないこと。
- 検定力に注目しているパラメータの、SEのバイアスが5%を超えないこと。
- 95%カバレッジ(95%信頼区間が真値を含んでいる反復の割合)が0.91~0.98であること。
... ってな感じで、結果を紹介。ま、結果はどうでもよくて、とにかくこういう風に話を進めていく、というデモンストレーションである。
当然ながら、導師はMplusのコードを公開してくださっている。ありがたいありがたい、南無南無。
論文:データ解析(-2014) - 読了:Muthen & Muthen (2009) 迷えるSEMユーザのためのサンプルサイズ決定ガイド