elsur.jpn.org >

2019年1月14日 (月)

Chow, S., Ho, M.R., Hamaker, E., Dolan, C.V. (2010) Equivalence and Differences Between Structural Equation Modeling and State-Space Modeling Techniques. Structural Equation Modeling, 17, 303-332.

 仕事の都合で泣く泣く読んだ奴。いま気がついたのだが、著者に動的因子分析のHamakerさん, 状態空間モデルのDolanさんがはいっている。先に著者名をちゃんとみておこうよ、俺...

 SEM(構造方程式モデリング)と状態空間モデリングのどこが同じでどこがちがうか説明しましょう、という論文。
 壮大な問題設定なのでびびってしまうが、あとでみるように、この論文がSEMと呼んでいるのはいわゆるSEMよりちょっと狭くて、測定変数間にパスがなく、因子に外生的な説明変数がないようなやつのことである(つまり、CFAの因子間にパス引いた奴)。SEM関連の本は全部オフィスの本棚に並べておるのでいまわからんが、普通そういうモデルはなんて呼ぶんですかね。多重指標モデル?

 イントロは省略して...

 まずSEMについて説明しよう。[原文の添字を簡略化してメモする]
 $y_i = \tau + \Lambda \eta_i + \epsilon_i$
 $\eta_i = \alpha + B \eta_i + \zeta_i$
ただし$y_i$, $\tau$, $\epsilon_i$は長さ$p$のベクトル, $\eta_i$, $\alpha$, $\zeta_i$は長さ$w$のベクトル。$\epsilon_i$の共分散行列を$\Theta$, $\zeta_i$の共分散行列を$\Psi$とする。
 母共分散行列と母平均は
 $\Sigma = \Lambda(I-B)^{-1} \Psi (I-B)^{-1'} \Lambda_{'} + \Theta$
 $\mu = \tau + \Lambda (I-B)^{-1} \alpha$
 SEMの場合、複数時点で測定しているデータについては、ふつうは$y_i$を二次元にするのではなくて長さを伸ばす。$T$時点の縦断データだったら、$T$時点がすべて$y_i$, $\eta_i$に叩き込まれるわけである。
 パラメータ推定にあたっては、ふつはMVNを仮定して尤度を求める。この場合は標本共分散行列$S$と標本平均ベクトル$m$があればよい。でもローデータから尤度を求めることもできる(以下RMLと呼ぶ。FIMLともいう)。時点数が個人数を超えている反復測定データなんかの場合はRMLを使わざるを得ない。
 RMLでは、個々の個人のデータベクトルの対数尤度を足し上げた
 $LL(\theta) = (1/2)\sum_i [-p \log(2\pi) - \log|\Sigma| - (y_i - \mu)^{'} \Sigma^{-1} (y_i - \mu)]$
を最大化する。MVNを仮定すると、この式はこう書き換えられる。
 $F(\theta) = (1/2)[\log|\Sigma|+tr(S\Sigma^{-1}) - \log|S| - p] + (1/2)[(m-\mu)^{'} \Sigma^{-1} (m-\mu)]$
 第1項はモデルの対数尤度、第1項は完全に飽和したモデル(つまり$\Sigma = S, \mu=m$であるモデル)の対数尤度である。これに$-2 (N-1)$を掛けるとカイ二乗統計量になる。[途中から写経モードに... まあ信じますよ先生]

 今度は状態空間モデルについて。
 $y_{it} = \tau + \Lambda \eta_{it} + \epsilon_{it}$
 $\eta_{it} = \alpha + B \eta_{i,t-1} + \zeta_{it}$
標準的な状態空間表記ではすべてのパラメータを時変とみるのだが、ここでは不変とみる。また外生変数もないことにする。
 パラメータ推定はふつうカルマン・フィルタ(KF)でやる。
 まず$t=0$における状態ベクトル$\eta_{i,0|0}$とその共分散行列$P_{0|0}$を決める。たとえば前者は0のベクトル、後者は$\kappa I$($\kappa$は十分に大きな数)とか。さらに、$\epsilon_{it} \sim N(0, \Theta)$, $\zeta_{it} \sim N(0, \Psi)$と仮定する。
 次に、各時点における$i$の状態ベクトルとその共分散行列を、それまでの観察によって予測する。
 $\eta_{i,t|t-1} = \alpha + B \eta_{i,t-1|t-1}$
 $P_{t|t-1} = B P_{t-1|t-1}B^{'} + \Psi$
以下では
 $e_{i,t|t} = y_{it}-(\tau + \Lambda \eta_{i,t|t-1})$
をイノベーションと呼ぶ(one-step-ahead予測誤差ともいう)。期待値は0である。
 さて、この2つの推定値を、その時点の観察を使って更新する。
 $\eta_{i,t|t} = \eta_{i,t|t-1} + K_{t|t} e_{i,t|t}$
 $P_{t|t} = [I-K_{t|t}\Lambda] P_{t|t-1}$
ただし
 $K_{t|t} = P_{t|t-1} \Lambda^{'} [\Lambda P_{t|t-1} \Lambda^{'} + \Theta]^{-1}$
これをカルマン・ゲインという。
 さて、全員について$T$時点の推定を行った暁には、イノベーション$e_{i,t|t-1}$とその共分散行列
 $G_t = E[e_{i,t|t-1}e_{i,t|t-1}^{'}]$
が手に入る。後者はすべての$i$について$\Lambda P_{t|t-1}\Lambda^{'}+\Theta$である。
 ここから対数尤度関数が手に入る。
 $LL(\theta) = (1/2)\sum_i \sum_t [-p \log(2\pi) - \log|G_t| -(e_{i,t|t-1}^{'})G_t^{-1} (e_{i,t|t-1}) ]$
これを予測誤差分解(PED)関数という。これを最大化すればいい。
 要約しよう。まずパラメータに初期値を与える。つぎにカルマンフィルタで個々人の各時点での状態を推定する(このときパラメータは定数とみなす)。次に状態推定を既知と見なしてパラメータをPED関数で推定する。このパラメータを定数とみなして新しい状態を推定する。これを繰り返す。

 いよいよ本題。SEMと状態空間モデリングは、どこが同じでどこがちがうか。
 ひとことでいうと次の通りである。どちらも「プールされた個人内ダイナミクス」を表現している。SEMは潜在変数間の同時的な構造的関係と、その関係の個人間の差を捉えるのに適している。状態空間モデルは、もっと複雑な個人内ダイナミクスを表現するのに適している。

 もっと細かくいうと次のとおり。以下、SEMのパラメータに添字$S$, 状態空間モデルのパラメータに添字$K$をつける。
 状態推定について。$B_K=0$とすれば、カルマンフィルタは回帰法による因子得点推定と同じである。また$B_K=0$で$\Psi_K$が無限大に近いとき(つまり事前情報がないとき)、カルマンフィルタはバートレット法による因子得点推定に近づく。[...中略...]
 パラメータ推定について。$T=1$の場合、$B_S = B_K = 0$となり、2つのモデルは等しい。$T > 1$の場合、$p_S = T \times p_K$ならば、対数尤度関数が同じになる。さらに$B_S = B_K = 0$なら、パラメータ推定値は同じになる。
 問題は$B_S, B_K$が0でない場合。特別な制約を付けない限りパラメータは変わってくる。その制約がどんなものかは、実例をみたほうが早かろう。

 実例1, 横断共通因子モデル。ここでみなさんに、「状態空間モデルはある個人の反復測定データを扱う手法である」というよくある思い込みから脱して頂きます。

 SEMの場合。$B$が0になるので、
 $y_i = \tau + \Lambda \eta_i + \epsilon_i$
 $\eta_i = \alpha + \zeta_i$
共分散行列を$\Theta = E(\epsilon_i \epsilon_i^{'}), \ \Psi = E(\zeta_i^2)$として、
 $\Sigma = \Lambda \Psi \Lambda^{'} + \Theta$
 $\mu = \tau + \Lambda \alpha$
 $LL = (1/2) \sum_i [-p \log(2\pi) - \log |\Sigma| - (y_i - \mu)^{'} \Sigma^{-1} (y_i - \mu)]$
対数尤度関数は状態空間モデルと同一になる。

 [ほんとなの? 試してみよう。
 $y_{it} = \tau + \Lambda \eta_{it} + \epsilon_{it}$
 $\eta_{it} = \alpha + \zeta_{it}$
イノベーションは本来は$e_{i,t|t-1} = y_{it}-(\tau + \Lambda \eta_{i,t|t-1})$だけど、$\eta_{i,t|t-1} = \alpha$だから
 $e_{i,t|t-1} = y_{it}-(\tau + \Lambda \alpha)$
 $G_t = \Lambda \Psi \Lambda^{'}+\Theta$
 $LL = (1/2) \sum_i \sum_t [-p \log(2\pi) - \log|G_t| -(e_{i,t|t-1}^{'})G_t^{-1} (e_{i,t|t-1}) ]$
なるほど、同じだわ]

 シミュレーション。$N=200, T=1, p=4$のデータについて$w=1$の共通因子モデルを組みます。パラメータの真値を適当に決めて架空データをつくり、LISRELとmkfm6(という状態空間モデルのプログラムがある由)で分析してみる。結果はほぼおなじ。

 実例その2, 単変量LDSモデル(Nが大きくてTが小さい場合)。
 McArdle & Hamagamiのlatent difference scoreモデルについて考える。(ああ、読んでおいて良かった... なにがいつ役に立つかわからんねぇ...)
 LDSモデルでは、観察の後ろに潜在変数$\eta_{it}$を考え、さらに「潜在変数の前期からの差」という潜在変数$\Delta \eta_{it}$を考える。
 $y_{it} = \eta_{it} + e_{it}$
 $\eta_{i, t+1} = \eta_{it} + \Delta \eta_{i,t+1}$
でもって、
 $\Delta \eta_{it} = \eta_{si} + \beta \eta_{i,t-1}$
と考える。$\eta_{si}$は$i$さんの定数項で変化の強さを表す。$\beta$は全員共通の定数項で、自己フィードバックを表す。以上をまとめると
 $\eta_{i,t+1} = \eta_{si} + (1+\beta) \eta_{it}$
$i$さんの時点0における切片項と変化の強さを、平均と偏差に分解して
 $\eta_{0i} = \mu_{\eta 0} + \zeta_{\eta 0 i}$
 $\eta_{si} = \mu_{\eta s} + \zeta_{\eta s i}$
$E(\zeta_{\eta 0 i}^2) = \sigma^2_{\eta 0}$, $E(\zeta_{\eta s i}^2) = \sigma^2_{\eta s}$とする。
 LDSモデルは要するに成長曲線モデルだと考えてよい。ちがいは、潜在傾きをさらにモデル化しているという点。

 SEMで表現してみましょう。
 長さ$T$のベクトル$y_i$を考える。測定モデル
 $y_i = \Lambda \eta_i + \epsilon_i$
で、潜在変数$\eta_i$を、長さ$T+1$のベクトル$[\eta_{i1}, \ldots, \eta_{iT}, \eta_{si}]'$とする。$\Lambda$は$T \times T$の単位行列の右に、すべて0の列をくっつけた奴にする。要するに、$\eta_{si}$は測定モデルには出てこないんだけど、話の都合上、潜在変数ベクトルにいれておくわけである。トリックですね。
 構造モデル
 $eta_i = \alpha + B \eta_i + \zeta_i$
では、$\alpha$は先頭が$\mu_{\eta 0}$、末尾が$\mu_{\eta s}$、ほかはすべて0のベクトルにする。$\zeta_i$も同様で、先頭が$\zeta_{0i}$、末尾が$\zeta_{si}$、ほかはすべて0である。
 $B$はどうなるか。時点1については(つまり$B$の1行目)、すべて0でよい。時点$2,\ldots,T$については(つまり$B$の2行目から$T$行目)、対角に$1-\beta$をいれた$(T-1) \times (T-1)$の対角行列の右に、すべて0の列($\eta_{iT}$にかかる係数)、すべて1の列($\eta_{si}$にかかる列)をくっつければ良い。最後の行は$\eta_{si}$をつくるための係数だから、すべて0。ね? 実は$\Delta \eta_{it}$なんていらないのだ。[←なるほど...]

 状態空間で表現してみましょう。[原文とはちがうが、話がややこしくなるので、状態空間モデルでの潜在変数はアスタリスクをつけて$\eta^{*}$とする]
 観察方程式
 $y_{it} = \Lambda \eta_{it}^{*} + \epsilon_{it}$
で、潜在変数$\eta_{it}^{*}$をベクトル$[\eta_{it}, \eta_{si}]'$にする。$\eta_{si}$は時間不変だし、そもそも観察変数には出てこない奴なので、変な感じだが、これもトリックですね。$\Lambda = [1,0]'$である。
 遷移方程式
 $\eta_{it}^{*} = B \eta_{i,t-1}^{*} + \zeta_{it}$
はどうなるか[ここ、原文に誤植があると思うので勝手に直した]。$\zeta_{it}$はすべて0。$B$は$2 \times 2$行列で、1行目($\eta_{it}$をつくる係数)は$[1-\beta, 1]'$。2行目は、時間不変だから$[0,1]'$。
 最後に、初期値$\eta^{*}_{i1|1}$を$\mu_{\eta 0}, \mu_{\eta 1}$, その共分散行列$P_{i1|1}$の対角要素を$\sigma^2_{\eta 0}, \sigma^2{\eta s}$とする。

 シミュレーション。$N=400, T=10$のデータについてLDSモデルを組む。パラメータの真値を適当に決めて架空データをつくり、LISRELとOx(という状態空間モデルのプログラムがある由)で分析してみる。結果はほぼおなじ。
 というわけで、LDSモデルはSEMとしても状態空間モデルとしても推定できるんだけど、後者のほうが便利。なぜなら、SEMだと(1)$T>N$のときに困るし、(2)$T$が大きいだけでえらいことになる。

 実例その3,自己回帰動的因子モデル($T$が大きくて$N=1$)。
 長さ$p$の観察ベクトル$y_{it}$について
 $y_{it} = \Lambda \eta_{it} + u_{it}$
 $\eta_{it} = A_1 \eta_{i,t-1} + A_2 \eta_{i,t-2} + \ldots + \zeta_{it}$
というのがこのモデル[原文に誤植があると思うので勝手に直した]。以下、2因子、6指標、ラグ1までのモデルを考えます。

 状態空間表現の場合。観察方程式
 $y_{it} = \Lambda \eta_{it} + \epsilon_{it}$
の$\eta$は長さ2のベクトル。$\Lambda$は$6 \times 2$の行列で、1列目を$[1, \lambda_{21}, \lambda_{31}, 0, 0, 0]'$, 2列目を$[0,0,0,1, \lambda_{52}, \lambda_{62}]'$とする(識別のためにひとつ1をいれている)。
 遷移方程式
 $\eta_{it}^{*} = B \eta_{i,t-1} + \zeta_{it}$
の$B$は$2 \times 2$の行列で、ラグ1の自己回帰係数。$\zeta_{it}$はこのVAR(1)プロセスで説明できない因子得点である。

 SEMの場合。データ行列は$N \times T p$となるわけで、共分散行列をつかった最尤推定はできない。ひとつの路線はRMLを使うことだが、計算が大変である。もうひとつはブロック・トープリッツ行列を使うという路線。こっちで考えます。
 [あれ、ほかにも方法があるのではなかろうか。まあいいけどさ]

 $N=10, T=200$でモンテカルロシミュレーションしてみよう。[...メモ中略...] とこのように、ブロック・トープリッツ行列路線はパラメータ推定値がけっこう歪む。それに個人レベルの因子得点も推定できない。お勧めできない。

 考察。
 心理学のみなさんは状態空間モデルをあまり使わない。もったいない。SEMにも状態空間モデルにもそれぞれ美点があるので、使い分けましょう。
 云々、云々。

論文:データ解析(2018-) - 読了:Chow, Ho, Hamaker, Dolan (2010) SEMと状態空間モデルのどこが同じでどこが違うか

2019年1月12日 (土)

 目の前の仕事に日々追い立てられる毎日であるが、副業というか研究開発的な案件のほうもそれはそれで追い詰められていて、年末、階層モデルについて考えていて頭が混乱してしまい、ちょっとしたパニックに陥った。とりあえず、抱えている問題と関係ありそうなPDFを拾って印刷し、年末年始でだだだーっと読んでみた。そのなかの一本。要は測定不変性に関する話で、とっつきやすい。

Im, M.H., Kim, E.S., Kwok, O.M., Yoon, M., Willson, V.L. (2016) Impact of Not Addressing Partially Cross-Classified Multilevel Structure in Testing Measurement Invariance: A Monte Carlo Study. Frontiers in Psychology, 7, 328.

 いわく。
 教育や社会科学においてはマルチレベルデータを扱うことが多いけど、たいていの場合階層線形モデルが用いられている。そこでは、下のレベルの事例は上のレベルのあるひとつのクラスタに属する。たとえば、ある生徒はある教室に属し、ある教室はある学校に属する。
 しかし現実はそうでない。生徒はふたつの学校に通っていたりするし、学校と地域のように、一方が他方の下にあるわけではないこともある。こういう非階層的なマルチレベルデータをcross-classifiedマルチレベルデータという。
 近年ではcross-classifiedマルチレベルデータを正しく分析することが大事だという理解が広まっている。Goldstein(1986 Biometrika, 1995書籍), Rasbash & Goldstein (1994 J.Educ.Behav.Statist.), Raudenbush & Bryk(2002書籍) をみよ。教科書への記載も増えておるぞ。実証研究も増えておるぞ。Fielding (2002 Sch.Eff.Sch.Improv.), Jayasinghe et al.(2003 JRSS), Marsh et al.(2008 J.Edu.Psy.)をみよ。
 しかるに、一部の者どもはcross-classifiedデータをいまだ階層線形モデルで分析しておる。実に嘆かわしいことである。
 cross-classifiedデータを階層データとして扱うとどうなるか。研究は少ないんだけど、分散成分の推定にバイアスがかかると指摘されている。

 さて。近年の社会科学においては、異なる集団間なり時点間なりでの測定不変性(MI)の検証が一般的になっている。階層的マルチレベルデータでにおけるMIの検証にはマルチレベル確認的因子分析(MCFA)が広く用いられている。それはいいんだけど、実際のマルチレベルデータは必ずしも階層になっていないのに、それでもふつうのMCFAが使われているのである。一般的なSEMのソフトではcross-classifiedマルチレベルデータのMCFAができないからである。[←これを読んで慌てて調べたが、これはちょっと吹かし気味のご発言で、Mplusには2012年秋リリースのVer.7の時点でがTYPE=CROSSCLASSIFIEDが搭載されている。現在もっとも一般的なSEMソフトといえばMplusだと思うんですが。ま、要するにMplus買いましょうってことっすね]

 というわけで、本研究は、cross-classifiedマルチレベルデータが測定不変性を持っているかどうかを検討するとき、cross-classifiedであることを正しく扱わなかったらどうなるかを調べる。

 まずは、ふつうのMCFAとcross-classified MCFAのちがいについて説明しよう[←ありがとうありがとう。それが読みたかったのよー]。

 2レベル, 1因子, 4指標の場合を考える。
 ふつうのMCFAの場合、ある生徒 $i$ はある学校 $j$ にのみ属する。観察ベクトルを$X[i,j]$と呼ぼう。いっぽうcross-classified MCFAでは、$i$は学校$j_1$と地域$j_2$に属する。観察ベクトルを$X[i, (j_1, j_2)]$と書こう。[原文では$X_{ij}$, $X_{i(j_1, j_2)}$なのだが、添字が深くなりすぎるので表記を変える。以下同様]

 ふつうのMCFAでは、Withinレベルで$x_1, x_2, x_3, x_4$に因子FWからパスが刺さり、さらにBetweenレベルで、$x_1, x_2, x_3, x_4$に因子FBからパスが刺さる。いっぽうcross-classified MCFAでは、Betweenレベルが学校のパートと地域のパートに分かれる。学校のパートでは$x_1, x_2, x_3, x_4$に因子FB1からパスが刺さり、地域のバートでは$x_1, x_2, x_3, x_4$に因子FB2からパスが刺さる。

 式で書こう。まず単純に、潜在変数を$\eta$として、普通のMCFAでは
 $X[i,j] = \tau + \Lambda \eta[i,j] + \varepsilon[i,j]$
cross-classified MCFAでは
 $X[i,(j_1,j_2)] = \tau + \Lambda \eta[i,(j_1,j_2)] + \varepsilon[i,(j_1,j_2)]$
観察値はMVNに従うものとする。(IID正規である必要はない。階層データだから)

 クラスタ間で変動するランダム効果をいれよう。ふつうのMCFAの場合、$\eta[i,j]$が2つに分かれる。
 $\eta[i,j] = \alpha + \eta_w[i,j] + \eta_b[j]$
$\alpha$は$\eta[i,j]$の期待値というか全体平均である。
 いっぽうcross-classified MCFAの場合、$\eta[i,(j_1,j_2)]$は3つに分かれる。
 $\eta[i,(j_1, j_2)] = \alpha[j_1] + \alpha[j_2] + \eta_w[i,j] + \eta_b[j_1] + \eta_b[j_2]$
$\alpha[j_1], \alpha[j_2]$はFB1, FB2の期待値である。[FWの期待値は0ってことね]

 元の式のほうも分解してみよう。ふつうのMCFAでは
 $X[i,j] = \tau_b + \Lambda_w \eta_w[i,j] + \Lambda_b \eta_b[j] + \varepsilon_w[i,j] + \varepsilon_b[j]$
 MCFAでは切片はBetweenレベルにしかないという点に注意。
 これがcross-classified MCFAだと
 $X[i,(j_1, j_2)]$
 $= \tau_b[j_1] + \tau_b[j_2]$
 $+ \Lambda_w \eta_w[i,j] + \Lambda_b[j_1] \eta_b[j_1] + \Lambda_b[j_2] \eta_b[j_2]$
 $+ \varepsilon_w[i,j] + \varepsilon_b[j_1] + \varepsilon_b[j_2]$
となる。切片は2つになる。

 因子分散も分解できる。ふつうのMCFAだと
 $V(\eta[i,j]) = \Psi_w + \Psi_b$
で、全分散に占める$\Psi_b$の割合を級内相関(ICC)という。いっぽうcross-classified MCFAだと
 $V(\eta[i,(j_1, j_2)]) = \Psi_w + \Psi_b[j_1] + \Psi_b[j_2]$
となる。ICCが2つできることになる。

 独自分散も分解できる。ふつうのMCFAだと
 $V(\varepsilon[i,j]) = \Theta_w + \Theta_b$
 $V(\varepsilon[i,(j_1,j_2)]) = \Theta_w + \Theta_b[j_1] + \Theta_b[j_2]$

 最後に、共分散行列$\Sigma_T$の分解。ふつうのMCFAの場合、共通因子$\eta$と独自因子$\varepsilon$が独立だという仮定の下で、
 $\Sigma_b = \Lambda_b \Psi_b \Lambda^{'}_b + \Theta _b$
 $\Sigma_w = \Lambda_w \Psi_w \Lambda^{'}_w + \Theta _w$
として$\Sigma_T = \Sigma_b + \Sigma_w$である。同様にcross-classified MCFAでは...[面倒なのでメモは省略するが、$\Sigma_T$が3つに分かれる]

 さて、測定不変性の話。
 測定不変性というのは因子-指標間の非線形的関係を含んだ広い言葉だが、線形因子モデルにおける測定不変性(因子不変性, FI)とは、パラメータが群間で等しいことをいう。その検証のためには、MCFAモデルにパラメータ等値制約を掛けていく。因子パターンが同じ(配置不変)、負荷が同じ(メトリック不変)、潜在変数の切片が同じ(スカラー不変)、独自分散が同じ(厳密不変)、というふうに。[ここで因子パターンといっているのは、いわゆる因子パターン行列のことじゃなくて、因子負荷行列のどこが0でないか、ということであろう]
 cross-classified MCFAの場合だとこうなる。以下、群を$g$で表す。モデルは
 $X_[i,(j_1,j_2),g]$
 $= \tau_b[j_1,g] + \tau_b[j_2,g]$
 $+ \Lambda_w[g] \eta_w[i,j,g] + \Lambda_b[j_1,g] \eta_b[j_1,g] + \Lambda_b[j_2,g] \eta_b[j_2,g]$
 $+ \varepsilon_w[i,j,g] + \varepsilon_b[j_1,g] + \varepsilon_b[j_2,g]$
 共分散行列を分解して
 $\Sigma_b[j_1,g] = \Lambda_b[j_1,g] \Psi_b[j_1,g] \Lambda^{'}_b[j_1,g] + \Theta_b[j_1,g]$
 $\Sigma_b[j_2,g] = \Lambda_b[j_2,g] \Psi_b[j_2,g] \Lambda^{'}_b[j_2,g] + \Theta_b[j_2,g]$
 $\Sigma_w[g] = \Lambda_w[g] \Psi_w[g] \Lambda^{'}_w[g] + \Theta_w[g]$
 まず配置不変性を検討する(因子数と各因子の指標数が群間で等しいといえるかを調べる)。
 次にメトリック不変性を調べる。帰無仮説は
 $\Lambda_b[j_1,1]=\Lambda_b[j_1,2]= \cdots = \Lambda_b[j_1,G]$,
 $\Lambda_b[j_2,1]=\Lambda_b[j_2,2]= \cdots = \Lambda_b[j_2,G]$,
 $\Lambda_w[1]=\Lambda_w[2]= \cdots = \Lambda_w[G]$。
 次にスカラー不変性を調べる。帰無仮説は
 $\tau_b[j_1,1]=\tau_b[j_1,2]= \cdots =\tau_b[j_1,G]$,
 $\tau_b[j_2,1]=\tau_b[j_2,2]= \cdots =\tau_b[j_2,G]$。
 最後に厳密不変性を調べる。帰無仮説は...めんどくさいから省略するけど、$\Theta$が等価だという3つの仮説ね。

 ここからは実験をふたつ。

 実験1。学校が20個、地域が50個あり、一方が決まると他方がある程度まで決まるというデータ(部分的cross-classifiedデータ)をつくる。cross-classified MCFA、1因子4指標で、3つのどのパートでも負荷は0.7から1のあいだであり、とりあえずはレベル間で共通とする(因子不変)。独自分散はwithinレベルで0.25, betweenレベルで0.05。
 動かす要因は2つ。(1)因子不変か。学校を2群にわけ、片方の群についてのみ、学校レベルの因子負荷を変える。大きく変える、小さく変える、変えない、の3水準。(2)ICC。因子分散を動かす。3水準。
 で、地域を無視したふつうのMCFAで測定不変性を調べる。
 結果。カイ二乗検定では、本当は因子不変である場合のType Iエラーには問題がないんだけど、本当は因子不変でない場合でも全然検出できない。学校レベルの因子負荷$\lambda_b[j_1]$の群間差(DIF)は過小評価される。

 実験2ではcross-classified MIMICモデルで測定不変性を調べる(群間で切片が異なるかどうかを、群を因子の共変量にいれることで調べられるかという話であろう)。これもMplus 7.4で実験している。面倒になったのでスキップ。

 考察。
 実験1では、FB2を無視したせいで、$\Psi_b[j_2]$が$\Psi_w$に再配分されてしまい、ICCが低く評価され、DIFが検出できなくなってしまった。[←ああ、そういうことなのか、なるほどね。2要因のANOVAをやるべきところを1要因でやったら、そのぶんセル内の分散が大きくなって、要因の主効果が有意じゃなくなっちゃいました、と云うような話なのであろう]
 このように、cross-classifiedデータで、一方のbetweenレベルの因子負荷が群間で異なるかどうか調べる場合、もう一方の因子を無視したふつうのマルチレベルCFAをやるのはお勧めできない。
 云々。

 ちゃんと読んでないけど、実験1は「注目しているクラスタ変数とクロスしているクラスタ変数を無視して階層多群分析するとクラスタ間での測定変動性を見落とすよ」という話、実験2は「群間で切片が異なることを見つけるだけでよければ多群分析じゃなくて群を共変量にいれたMIMICモデルにするといいよ」という話なのではないかと思う。でもこの実験、Mplus 7.4でやったんでしょ? なんでTYPE=CROSSCLASSIFIEDを使わないの?と不思議に思いながら読んでいたのだが、あー、そうか、CROSSCLASSIFIEDだとGROUPING=オプションが使えないのかも。

 ともあれ、cross-classified SEMというのがどういうものなのかが理解できたので良しとしよう。
 ほんとはさあ... Muthen一家の誰かが解説を書いてくれるといいんだけどさあ... とぶつぶつ不満を漏らすわけだが、別に新しい話題ってわけじゃないのだろうな。いまのホットトピックはきっと強縦断データとかだろうし。すいません、自分で勉強します。とりあえずはRaudenbush & Brykを手に入れるか...

論文:データ解析(2018-) - 読了: Im, et al.(2016) cross-classifiedマルチレベルデータをただの階層データとみなしたときの弊害 (多群CFAで測定不変性を検証する編)

Tellis, G. J. (2006) Modeling Marketing Mix. in Grover, R. & Vriens (eds), The Handbook of Marketing Research: Uses, Misuses, and Future Advances, Sage.

 年末に仕事の都合で大急ぎで目を通した奴。Marketing Mix Modeling (通称MMM。なんでも略すればいいってもんではないだろうに) について急遽整理する必要が生じ、参ったなと思ったら、このハンドブックに1章が割かれていた。困った時のGrover & Vriens である。
 著者はマーケティングの先生で、「意志とビジョン: マーケット・リーダーの条件」という邦訳書がある。しらんけど。

 いくつかメモ:

 著者曰く、広告に対する反応にみられる重要なパターンが7つある。(1) current effect, (2) carryover effect, (3) shape effect (広告-売上関係が曲線的だという話), (4) competitive effects, (5) dynamic effect (wearin, wearout, hysteresis), (6) content effects, (7) media effects. レベルが揃ってなくてすごく気持ち悪い...

 広告反応のモデルとして著者は次の5つを挙げている。

  • 基本的な線形モデル: 
    $ Y_t = \alpha + \beta_1 A_t + \beta_2 P_t + \beta_3 R_t + \beta_4 Q_t + \varepsilon_t$
    $Y_t$は売上かなにか、$A_t$は広告かなにか(以下「かなにか」を省略), $B_t$は価格, $R_t$はプロモーション, $Q_t$は品質。$\varepsilon_t$はIID normalだと思っているわけですね。
  • 乗法モデル: 
    $ Y_t = \exp(\alpha) \times A_t^{\beta_1} \times P_t^{\beta_2} \times R_t^{\beta_3} \times Q_t^{\beta_4} \times \varepsilon_t $
    推定の際には全部対数にする。利点: (1) シナジーをモデル化できている。(2)いろんな曲線を表現できる。(3)$\beta$が弾力性になっている。欠点: (1)carryover, competitive effects, dynamic effects, content effects, media effectsを表現できていない。(2)S字型の曲線を表現できない。(3)広告の弾力性は一定だと仮定していることになる。[いちいち書かないけど、頭のなかに疑問符が乱舞する... もっと厳密に書かれた説明を読みたいのに]
  • 指数魅力モデルと多項ロジットモデル。めんどくさいので途中端折るけど、市場シェアを各ブランドのマーケティング努力の指数におけるシェアとし、マーケティング努力について線形モデルを組んで
    $ M_i = \exp(\sum_k \beta_k X_{ik} + e_i) / \sum_j \exp(\sum_k \beta_k X_{jk} + e_j)$
    という感じ(めんどくさいので独立変数は$X_{ik}$と書く...)。しかしこれだと係数を解釈しにくいし推定も大変なので対数中心化する。結局
    $ \log(M_i M^{-}) = \alpha^{*}_i + \sum_k \beta_k X_{ik}^{*} + e_i^{*}$
    となる。$M^{-}$ってのは幾何平均ね。これは結局多項ロジットモデルになっている。利点: (1)競合も考慮している、(2)関数形がS字型になっている、(3)市場シェアの独立変数に対する弾力性が、マーケティング努力にたいしてベル型になる。
  • Koyckモデルと分散ラグモデル。まず、
    $Y_t = \alpha + \lambda Y_{t-1} + \sum_k \beta_k X_{ik} + \varepsilon_t$
    これがKoyckモデル。限界: (1)carryoverは減衰だと決めてかかっている。(2)個別の変数についてのcarryoverを推定するのは大変。(3)データの時間間隔によって結果が大きく変わる。そこでもっと一般化して
    $Y_t = \alpha + \lambda_1 Y_{t-1} + \lambda_2 Y_{t-2} + \ldots + \beta_{10} A_{t} + \beta_{11} A_{t-1} + \ldots $
    というように広げるのが分散ラグモデル。でも多重共線性がひどくなり推定が安定しない。データが足りない場合はKoyckモデルのほうが良い。
  • 階層モデル。そのまえにダミー変数回帰について考える。たとえば広告の内容が2種類ある場合、一方であることを表すダミー変数$A_{2t}$をつくり、
    $Y_t = \alpha + \beta_1 A_t + \delta A_t A_{2t} + \ldots $ 
    という風に交互作用項をいれる。当然ながら、広告の種類が増えるとめっちゃ複雑になる。そこで階層モデルの登場...[めんどくさいのでメモ省略。というか、数式で書いてよ!かえってわけわかんなくなるから!]。データがリッチなら、指数魅力モデルとかKoyckモデルとかと併用してもよい。

 後半は価格反応の話とモデル例。死ぬほど眠くなってきたので、ばーっとめくって読了ということに。

 やれやれ。著者の先生には悪いけど、これ、素人向けにわかりやすく書こうとしてかえって曖昧模糊となる、という典型例なのではないかと思う。

論文:マーケティング - 読了: Tellis (2006) マーケティング・ミックス・モデリングについて初心者諸君のために解説してあげよう

2019年1月 6日 (日)

 昨年暮れ、学会発表のための分析をやっててわけがわからなくなり、頭を整理するために、Mplusユーザーズ・マニュアル9章(complex survey dataの階層モデリング)の事例40個を全部読んだ。そのときにとったメモ。
 事例9.30-9.40はAR(1)構造がはいって難しさもさらにグレードアップするのだが、当面使う予定がないので(←言い訳)、メモも省略している。

  • TYPE=TWOLEVELで、WITHINレベルでもBETWEENレベルでも x が y に刺さっているとき、データとしてxのクラスタ別平均 xm をつくっておいて、 MODELで
    %WITHIN%
    y ON X;
    %BETWEEN%
    y ON xm;
    とする手と、単に
    %WITHIN%
    y ON x;
    %BETWEEN%
    y on x;
    とする手がある。前者の場合はDATAでWITHIN=x; BETWEEN=xm;と宣言すること。いっぽう後者の場合、xはWITHINレベルの潜在変数とBETWEENレベルの潜在変数に分解されていることになる。階層回帰モデルの一般的アプローチではないけれど、xmの信頼性が低いときに後者がお勧め。[←これを読んで、むしろ前者がアリだということに驚いた。個票があるのに標本平均をデータにするなんて邪道という気がするが、クラスタのサイズが十分に大きければ構わんってことか...] なお、後者のモデルにおけるBETWEENレベルの係数とWITHINレベルの係数の差を、Raudenbush & Bryk (2002)は「文脈効果」と呼んでいる[←どういう意味だろう?](事例9.1)
  • TYPE=RANDOMのときの縦棒("|")の左はランダム回帰係数の名前を表すが、TYPE=TWOLEVEL RANDOMで%WITHIN%での指定だったらそのランダム回帰係数はBETWEENレベルの変数になりますわね。ところがアスタリスクをつけると(「s* | y on x」という風に)、これはWITHINでも分散を持つようになる。[←これはほんとに、いままでぜんっぜん知らなかった。こういうことがあるからMplusは怖い...] (事例9.14)
  • TWOLEVEL RANDOMでは、
    %WITHIN% 
    logv | y;
    %BETWEEN%
    logv on w;
    というようなモデルを組める。logvはyの残差分散の対数を表す。[そうそう、これも謎の機能で... ESTIMATOR=BAYESが登場してから追加された機能だと思う。理屈はわかるけど、どういうときに使えばいいのかがいまいちわからない。係数がクラスタによって違うモデルをつくりたいというのはわかるけど、残差分散がクラスタによって違うモデルをつくりたいってことはあるのか...あるか... そうか...] (事例9.28)

 ところで、Mplusは結構長く使っているはずなのだが、それでも「えええ、そんなことができるの」と呆れたモデルがあったので、呆れついでにメモしておく。事例9.26。変数はu(カテゴリカル)、subject, itemの3つ、subjectとitemがクラスタのCROSSCLASSIFIED RANDOMモデル(THREELEVEL RANDOMではないという点に注意)。

%WITHIN%
%BETWEEN subject%
s | f BY u; f@1; u@0;
%BETWEEN item%
u; [u$1]; s; [s];

つまり、subjectレベルではuは分散1の潜在変数fに残差無しで規定されていて、その負荷というかプロビット回帰係数がsである(uをテスト項目の正誤とすると、fは対象者の能力、sは項目の識別性のようなものであろう)。uはitemレベルで切片が動き、残差分散も動く。さらにsも、subjectのなかでは動かないけどitemレベルで動く。ええええ... そういうのを組みたくなる動機はわかるけど、まさかほんとに組めるとは。 sはsubjectレベルで定義されているからitemレベルではモデル化できないかと思った。CROSSCLASSIFIEDモデルおそるべし。

 いやあ、やっぱり使っているソフトのマニュアルは読むべきだ... 読むべきものが多すぎて辛い...
 Mplusについては、Muthen一家の手によるものを含め、多種多様なレベルの解説が手に入るのだが、CROSSCLASSIFIEDモデルについてのまとまった解説は見当たらない。どこかにないかしらん。

雑記:データ解析 - 覚え書き: Mplusがご提供する階層モデリングのための謎機能たち

 ここ数日ずっと机に向かってて、もううんざりしてきて、人生どこで間違えた?というあてのない問いを先程から繰り返している状態なので、気分を変えて、Evernoteに溜まっている昨年中の雑多なメモを整理することに。これが終わったら神社に初詣にでも行こう、もう1月も6日だけど...
 これは昨年6月頃に取ったメモ。読み返すと、これ書いてたとき、たしかなにかの締切のようなものから逃避していたなあ、という情緒的イメージだけが蘇ってきて、心臓がバクバクしてきた。

 New York Timesの電子版をぼけーっと眺めていたら、「この25年間の米国演劇を25本選ぶ」というような記事があった。ふと思ったんだけど、この25本のなかで何本くらいが日本で上演されているんだろうか? 全然知らないけど、アメリカの芝居の翻訳上演のチラシって、結構よく見かけるような気がするんですよね。
 というわけで、google様で検索してはメモをとる、というのを25回繰り返してみた。書籍と違って舞台というのはあっさり消えていくものなので、たぶん見落としがあるだろうと思うけど。

  • Topdog/Underdog (Suzan-Lori Parks, 2001) : 2012年に世田谷シアタートラムで上演されている。小川絵梨子演出。
  • An Octoroon (Branden Jacobs-Jenkins, 2014) : 見当たらない。
  • The Flick (Annie Baker, 2013) : 2016年, 新国立劇場(「フリック」, マキノノゾミ演出)。
  • Mr.Burns, a Post Electric Play(Anne Washburn, 2013): 見当たらない。
  • Clybourne Park (Bruce Norris, 2010): 見当たらない。
  • Ruined (Lynn Nottage, 2008): 見当たらない。
  • How I Learned to Drive (Paula Vogel, 1997): 2009年に青年座で2014年に下北沢(小川絵梨子演出)で上演されている。題名はいずれも「運転免許 私の場合」。これ、面白そう...
  • Seven Guitars (August Wilson, 1996): 見当たらない
  • Twilight: Los Angeles, 1992 (Anna Deavere Smith, 1994): 見当たらない
  • The Designated Mourner (Wallace Shawn, 2000): 見当たらない。ウォレス・ショーンって、なにかの映画にでていた俳優だと思うのだが、劇作家でもあったのか。
  • The Humans (Stephen Karam, 2015): 見当たらない。
  • This Is Our Youth (Kenneth Lonergan, 1996): 見当たらない。作者は映画「マンチェスター・バイ・ザ・シー」の監督だそうだ。へー。
  • Three Tall Women (Edward Albee, 1994): 作者は「バージニア・ウルフなんてこわくない」のオールビー、晩年の作品だそうだ。黒柳徹子さんがパルコのプロデュースで喜劇の舞台を長く続けていたが(1989-2018年)、1996年と2003年の演目がこれだったらしい。題名は「幸せの背くらべ」。
  • Jesus Hopped the 'A' Train (Stephen Adly Guirgis, 2000): 見当たらない。
  • Eurydice (Sarah Ruhl, 2006): 見当たらない。
  • House/Lights (Wooster Group, 1999): 見当たらない。なんかよくわからんが、マルチメディアを駆使したパフォーマンスなのだそうです。
  • The Lamamie Project (Moises Kaufman, 2000): 2001年と2003年に燐光群が上演したらしい
  • Yellow Face (David Henry Hwang, 2007): 見当たらない。面白そうなんだけどなあ...
  • August: Osage County(Tracy Letts, 2007): 2016年にシアター・コクーンで上演(「8月の家族たち」, ケラリーノ・サンドロヴィッチ演出)。なお、2013年にメリル・ストリープ主演で映画になっている。
  • The Vagina Monologues (Eve Ensler, 1996): これは私でも知っている。訳書も出ているし、日本でも何度も上演されている模様。
  • Underground Railroad Game (Jennifer Kidwell and Scott R. Sheppard, 2016): 見当たらない。
  • The Wolves (Sarah DeLappe, 2016): 見当たらない。
  • The Realistic Joneses (Will Eno, 2012): 見当たらない。
  • The Apple Family Plays (Richard Nelson, 2010): 見当たらない。
  • The Elaborate Entrance of Chat Deity (Kristoffer Diaz, 2010): 見当たらない。

というわけで、日本での翻訳上演が確認できたのは25本中7本であった。多いような、少ないような。

雑記 - NYTが選ぶところの過去25年間のアメリカ演劇25

2019年1月 4日 (金)

Bookcover ザ・空気 [a]
永井 愛 / 而立書房 / 2018-07-25
2017年上演、大変評判になった戯曲。

フィクション - 読了:「ザ・空気」

Bookcover 市場の倫理 統治の倫理 (ちくま学芸文庫) [a]
ジェイン ジェイコブズ / 筑摩書房 / 2016-02-09
この秋に読んでいた本。2018年に出会った大当たりの一冊であった。原題は"Systems of Survival: A Dialogue of the Moral Foundations of Commerce and Politics"。「倫理的基盤」といわれるとちょっと引いてしまうけれど、社会の矛盾をふたつの概念的フレームワークの対立という観点から描き出す知的エンターテイメント、という感じの内容。よく考えてみると厳密な議論じゃないような気もするんだけど、面白い本であった。

Bookcover 徹底検証 神社本庁 (ちくま新書) [a]
藤生 明 / 筑摩書房 / 2018-10-05

Bookcover 海賊の日本史 (講談社現代新書) [a]
山内 譲 / 講談社 / 2018-06-21

Bookcover 異端の時代――正統のかたちを求めて (岩波新書) [a]
森本 あんり / 岩波書店 / 2018-08-22

Bookcover マルクスと批判者群像 (平凡社ライブラリー) [a]
良知 力 / 平凡社 / 2009-02-01

Bookcover 現代社会はどこに向かうか――高原の見晴らしを切り開くこと (岩波新書) [a]
見田 宗介 / 岩波書店 / 2018-06-21

Bookcover ルポ 不法移民とトランプの闘い 1100万人が潜む見えないアメリカ (光文社新書) [a]
田原徳容 / 光文社 / 2018-10-16

ノンフィクション(2018-) - 読了:「市場の倫理 統治の倫理」「神社本庁」「異端の時代」「マルクスと批判者群像」「現代社会はどこに向かうか」「不法移民とトランプの闘い」「海賊の日本史」

Bookcover 往生要集―日本浄土教の夜明け (2) (東洋文庫 (21)) [a]
源信 / 平凡社 / 1964-06-01

Bookcover 新版 歎異抄―現代語訳付き (角川ソフィア文庫) [a]
/ 角川書店 / 2001-07-01

Bookcover 親鸞・普遍への道―中世の真実 (ちくま学芸文庫) [a]
阿満 利麿 / 筑摩書房 / 2007-04-01

Bookcover 幸福とは何か - ソクラテスからアラン、ラッセルまで (中公新書) [a]
長谷川 宏 / 中央公論新社 / 2018-06-20

Bookcover チベット仏教入門 (ちくま新書) [a]
吉村 均 / 筑摩書房 / 2018-11-06

哲学・思想(2011-) - 読了:「チベット仏教入門」「往生要集」「歎異抄」「親鸞・普遍への道」「幸福とは何か」

Bookcover FEAR 恐怖の男 トランプ政権の真実 [a]
ボブ・ウッドワード / 日本経済新聞出版社 / 2018-12-01

Bookcover いいビルの世界 東京ハンサムイースト [a]
東京ビルさんぽ / 大福書林 / 2017-10-09

Bookcover 戦略の世界史(上) 戦争・政治・ビジネス [a]
ローレンス・フリードマン / 日本経済新聞出版社 / 2018-09-26

Bookcover 運慶のまなざし――宗教彫刻のかたちと霊性 [a]
金子 啓明 / 岩波書店 / 2017-11-08

Bookcover 漂流児童 [a]
石井 光太 / 潮出版社 / 2018-10-05

ノンフィクション(2018-) - 読了:「いいビルの世界」「運慶のまなざし」「漂流児童」「戦略の世界史」「恐怖の男」

Bookcover さよならミニスカート 1 (りぼんマスコットコミックス) [a]
牧野 あおい / 集英社 / 2018-11-22
講談社の少女誌「りぼん」が大見得を切って開始した連載。どんなものかと手に取ってみて、なるほどなあ、と納得...

Bookcover はじめてのひと 3 (マーガレットコミックス) [a]
谷川 史子 / 集英社 / 2018-09-25
名匠・谷川史子の漫画であるからして、素敵な恋愛話になってますけど、でもこれ不倫ですよね!この16歳年上のチェリスト、こいつ要はクズですよね!とひとりで憤りながら読んでいた。おっさんはね!こういう男には厳しいよ!!

Bookcover ゆりあ先生の赤い糸(1) (BE LOVE KC) [a]
入江 喜和 / 講談社 / 2018-07-13
Bookcover ゆりあ先生の赤い糸(2) (BE LOVE KC) [a]
入江 喜和 / 講談社 / 2018-10-12
私が尊敬してやまないマンガ家・入江喜和さんの新作。前作「たそがれたかこ」もそうだったけど、ちょっと類例が思い浮かばない作品なので、果たして読者がついてくるだろうか...打ち切りになりませんように...と勝手に気を揉んでいる。

コミックス(2015-) - 読了:「さよならミニスカート」「はじめてのひと」「ゆりあ先生の赤い糸」

<< 読了:「ダルちゃん」「ランド」「神は細部に宿るのよ」「邦キチ!映子さん」「きょうのカプセル」
 
validate this page / CSS