多群解析は,複数の母集団から得られたデータによって測定不変性と母集団異質性を検討する際に用いられる。
多群分析は TYPE=MIXTUREやTYPE=EFAでは利用できない。TYPE=MIXTUREで多群分析を行うためにはVARIABLEコマンドのKNOWNCLASSオプションを用いる。
本章では以下のトピックについて論じる。
多群分析を指定する方法は,分析するデータのタイプによって異なる。
状況によっては,プログラムがどの群を第一群だとみなしているかを知る必要が生じる。第一群が決定される仕方は,分析するデータのタイプによって異なる。
FILE (male) IS male.dat; FILE (female) IS female.dat;
多群分析においては,測定パラメータのうち一部はデフォルトで群間等値となる。これによりそれらのパラメータの測定不変性が表現される。
多群分析では2種類のMODELコマンドを用いる。すなわち,MODELとラベルつきMODELである。
ラベルの定義は以下の方法で行う。
群特定モデルのなかで各群のモデルを完全に記述する必要はない。群特定モデルには,全体のMODELコマンドと,その群のモデルとのちがいだけを含めればよい。
MODEL: f1 BY y1 y2 y3; f2 BY y4 y5 y6;
f1はy1, y2, y3によって測定され,f2はy4, y5, y6によって測定されている。 因子のメトリックはプログラムによって自動的に以下のように指定される。まず,各BY文における最初の因子負荷は1に固定される。他の因子負荷と,因子指標の切片は,群間で等しいとされる。残差分散は各群ごとに推定される。残差共分散は0に固定される。因子分散と因子共分散は群ごとに推定される。
MODEL g2: f1 BY y2 y3; f2 BY y5 y6;
y2, y2, y5, y6の因子負荷が群間で等しいという制約が緩和されている。ここで各因子の最初の因子指標を含めてはいけない。なぜなら,それらの因子負荷を1は固定し,因子のメトリックを指定しなければならないからである。
因子平均は,第一群では0に固定され,残りの群では推定される。 以下の群特定MODELコマンドは,観察された従属変数の切片と閾値が群間で等しいという制約を緩和している。
MODEL g2: [y1 y2 y3]; [u4$1 u5$1 u5$1];
以下の一連のMODELコマンドは,群g1, g2, g3の多群分析のためのものである。
MODEL: f1 BY y1-y5; f2 BY y6-y10; f1 ON f2; MODEL g1: f1 BY y5; MODEL g2: f2 BY y9;
全体のMODELコマンドについてみてみよう。最初のBY文は,f1がy1, y2, y3, y4, y5によって測定されていると指定している。次のBY文は,f2がy6, y7, y8, y9, y10によって測定されていると指定している。これらの因子のメトリックは,プログラムによって自動的に以下のように指定される。すなわち,それぞれのBY文の最初の因子負荷は1に固定される。他の因子負荷と因子指標の切片は群間で等しいものとされる。y1〜y10の残差分散は群ごとに推定される。残差共分散は0に固定される。因子f2の分散と,因子f1の残差分散は,各群ごとに推定される。f1とf2のあいだの線形回帰の回帰係数は群ごとに推定される。
その後のラベルつきMODELコマンドで,全体モデルと群特定モデルのちがいが指定されている。まず,群g1におけるy5の因子負荷が他の2群におけるy5の因子負荷と等しいという制約がなくなっている。また,群g2におけるy9の因子負荷がほかの2群におけるy9の因子負荷と等しいという制約がなくなっている。g3についての群特定モデルがないので,g3のモデルは全体のモデルと同一である。
等値制約をあらわすためには,パラメータ(のリスト)のあとに,数字(のリスト)をカッコにいれて指定する。13章では,単群分析でパラメータに等値制約を課する方法について述べた。単群分析の場合,パラメータに等値制約を課するためには,等しくしたいパラメータのあとに,おなじ番号(のリスト)をカッコにいれて記述する。たとえば次の例では,最初の2つの式における回帰係数が等しく,そのあとの3つの式における回帰係数が等しい,と制約されている。
y1 ON x1 (1); y2 ON x2 (1); y3 ON x3 (2); y4 ON x4 (2); y5 ON x5 (2);
多群分析の場合,等値制約の解釈は,それが全体のMODELコマンドのなかにあるか,それとも群特定MODELコマンドのなかにあるかで変わってくる。全体のMODELコマンドのなかで指定された等値制約は全群に適用される。群特定MODELコマンドのなかで指定された等値制約はその群だけに適用される。
MODEL: f1 BY y1-y5; y1 (1) y2 (2) y3 (3) y4 (4) y5 (5);
それぞれの残差分散のあとに,異なる番号をカッコに入れて記述している。これにより, それぞれの残差分散は群間で等しくなるが,お互いには等しくならない。一行には等値制約をひとつしか指定できないことに注意。
MODEL: f1 BY y1-y5; y1-y5 (1);
残差分散のリストのあとに,ひとつの番号をカッコに入れて記述している。これにより,y1, y2, y3, y4, y5の残差分散は,お互いにも群間でも等しくなる。5つの誤差分散を3群で自由推定すると,15個のパラメータがあることになるが,この等値制約をおけば,パラメータがひとつだけ推定されることになる。
MODEL g2: y1-y5 (2);
y1からy5の残差分散は,群g2に関しては等しくなるが,他の群の残差分散とは等しく ならない。なぜなら(2)は全体のMODELコマンドでも他の群特定MODELコマンドでも指定されていないからである。群g2において残差分散がひとつ推定される。
MODEL g3: y1-y5;
群g3では,残差分散は群g1と等しくならず,5つの残差分散が推定される。
MODEL: f1 BY y1-y5; y1-y5 (1); MODEL g2: y1-y5 (2); MODEL g3: y1-y5;
群g1についての群特定MODELコマンドがないので,群g1では全体のMODELコマンドと同じモデルを用いることになる。群g2では,推定される残差分散はひとつで,それは他の群と等しくない。群g3では,推定される残差分散は5つで,それらは他の群と異なる。
多群分析では,デフォルトではつぎのように指定される。
平均,切片,閾値を指定するためには角カッコを用いる。
MODEL: f1 BY y1-y5; f2 BY y6-y10; f1 ON f2; MODEL g1: [f1 f2]; MODEL g2: [f1@0 f2@0];
まずデフォルトの指定で,因子の指標y1-y5の切片と因子負荷が3群間で等しくなっている。群g1の群特定MODELコマンドで,f2の平均とf1の切片が自由であると指定されている。 群g2の群特定MODELコマンドで,f2の平均とf1の切片が0に固定されている。
MODEL g2: [y1-y10];
群特定MODELコマンドで,観察された従属変数の切片が群間で等しいという制約が緩和されている。
多群分析においてはスケール・ファクタを用いることができる。 観察された従属変数がカテゴリカルで,かつWLS推定を用いている場合には, スケール・ファクタの利用を推奨する。 スケール・ファクタは, 観察されたカテゴリカル従属変数に対応する潜在反応変数の, 群間での分散のちがいを示すパラメータである。
観察されたカテゴリカル従属変数が存在するとき,デフォルトでは WLS推定が使用され,モデルにはスケール・ファクタが含まれている。 第一群のスケール・ファクタが1に固定されており,他の群のスケール・ファクタは 初期値1で自由推定される。
スケール・ファクタを指定するためには波カッコを用いる。
MODEL: f BY u1-u5; MODEL g2: {y1-y5*.5};
群g1においては,デフォルトにより,観察されたカテゴリカル従属変数に対応する 潜在反応変数のスケールファクタは1に固定されている。群2における スケール・ファクタは自由で,その初期値が与えられている。
観察されたカテゴリカル従属変数のパラメータ化にシータ法を用い,WLS推定を用いているときには,それらに対応する潜在反応変数の残差分散が,デフォルトでモデルの一部となっている。この状況では,すべての観察されたカテゴリカル従属変数について,残差分散は第一群で1に固定され,他の群では初期値1で自由推定される。
潜在反応変数の残差分散を指定するためには,それに対応する観察された変数の名前を用い3る。
ここでu1-u5は観察されたカテゴリカル従属変数である。
MODEL: f BY u1-u5; MODEL g2: u1-u5*2;
観察されたカテゴリカル従属変数に対応する潜在反応変数の残差分散は,群g1では デフォルトにより1に固定されている。群g2においては自由で,その初期値が与えられている。
いくつかの群の個人データをひとつのデータセットにいれる場合, データセットはそれぞれの オブザベーションがどの群に属するかを示す変数(グルーピング変数) を含んでいなければならない。
グルーピング変数の名前は,VARIABLEコマンドのGROUPINGオプションで指定する。 指定できる変数はひとつだけである。複数の変数の組み合わせ(例, 性別と民族) によって群を表現しなければならない場合には,DEFINEコマンドをつかって グルーピング変数を作成できる。
GROUPINGオプションの使い方の例を示す。
GROUPING IS gender (1=male 2=female);
グルーピング変数名の直後にあるカッコの中身は,データセットにおける グルーピング変数の値にラベルを割り当てている。この例では, 変数genderが1であるオブザベーションにmaleというラベルが割り当てられ, 2であるオブザベーションにfemaleというラベルが割り当てられている。 これらのラベルは,群特定MODELコマンドで用いられる。
GROUPINGオプションで指定されなかったグルーピング変数の値を持っている オブザベーションは,分析から除外される。
個人データが複数のデータセットに保存されている場合の多群分析では、 DATAコマンドのFILEオプションについて2つの変更が生じる。 第一に、それぞれのデータセットについてFILE文が必要になる。 第二に、FILEオプションでラベルをつけ、そのラベルを 群特定MODELコマンドで使うことができるようになる。たとえば、 男性のデータがmale.datに保存され、女性のデータが female.datに保存されているとしよう。FILEオプションを次のように 指定する。
FILE (male) = male.dat; FILE (female) = female.dat;
ラベルmaleとfemaleを群特定MODELコマンドで使用し、男性・女性の群特定 モデルと全体モデルとの違いを指定できる。
個人データが異なるデータセットに保存されている場合、 すべてのデータセットが同じ数の変数を持っている必要がある。 これらの変数は同じ名前を持ち、同じ形式で読めるものでなければならない。
要約データは、第1群のデータ、第2群のデータ...という順で、 ひとつのデータセットに保存されていなければならない。 たとえば、4変数、2群について、平均と共分散行列を分析する場合、 データは次のようになる。
0 0 0 0 2 1 2 1 1 2 1 1 1 2 1 1 1 1 3 2 3 2 2 3 2 2 2 3
先頭から順に、群1の平均、群1の共分散、群2の平均、群2の共分散である。
要約データの多群分析では、NOBSERVATIONSオプションとNGROUPSオプションが 特別な形式を持つ。 NOBSERVATIONSオプションは、各群についてひとつ、 データがデータセット上で登場する順番で、エントリを持つ必要がある。 たとえば、最初に男性の要約データ、次に女性の要約データがある場合、 NOBSERVATIONS文
NOBSERVATIONS = 180 220;
は、男性の要約データが180件の観察事例、女性の要約データが220件の 観察事例から得られたものであることを示す。
さらに、要約データの場合、群の数をDATAコマンドのNGROUPSオプションで 指定しなければならない。このオプションの形式は次の通り。2群の場合は
NGROUPS = 2;
要約データの場合、プログラムは最初の群にラベルg1、次の群にラベルg2、 というようにラベルを自動的に付与する。この例では男性がg1、女性がg2となる。
多群分析においては,一連のネストされたモデルについて,因子の測定不変性を カイ二乗検定や対数尤度検定によって検定することができる。
以下では、さまざまなタイプの変数と推定量に関して、 測定不変性を検証するために使えるモデルについて述べる。 これらのモデルは縦断的な測定不変性の検証にも利用できる。 その場合、群間ではなく時点間に、必要な制約を置くことになる。
(ここの説明はExcelファイル にまとめました。)
完全な測定不変性が維持できない場合, 部分測定不変性について検討することができる。 つまり,測定パラメータのいくつかの等値制約を緩和してやるわけである。
測定不変性についてカイ二乗検定を行う場合は以下のようにする。 制約の緩いモデルのカイ二乗値と自由度を,制約の厳しいネストされたモデル のカイ二乗値と自由度から引く。自由度の差に対応するカイ二乗値を カイ二乗表から探し,それと上記のカイ二乗差とを比べる。
カイ二乗値が利用できないモデルでは,対数尤度の差の-2倍を用いて 検定することができる。