« 読了:芳賀(2005) 製品開発のための 3-step research | メイン | 読了: Grun & Hornik (2001) topicmodels パッケージ »
2014年6月22日 (日)
先日リリースされたMplus 7.2の改訂点を、こちらで公開されているPDFからメモしておく。すいません、純粋に自分のためのメモです。
一番大きな追加機能は、混合モデルで非正規分布を指定できるようになったこと。ANALYSISコマンドでTYPE=MIXTUREのときDISTRIBUTIONオプションで指定する。NORMAL(正規分布), SKEWNORMAL(歪正規分布), TDISTRIBUTION(t分布), SKEWT(歪 t 分布)から選べる。数値積分時は不可。うーむ、まだ使い方が良くわからない... Web Note #19を読めばいいのだろうか。
なお、ESTIMATOR=BAYES;POINT=MODEのときにモード推定のための反復回数の上限をDISTRIBUTIONオプションで与えることができるけど、それと同名だがちがうオプションである。あれれ、じゃ「TYPE=MIXTURE; ESTIMATOR=BAYES;POINT=MODE;」としたらDISTRIBUTIONオプションはどちらの意味になるのだろうか。今度試してみよう。
実はこの非正規分布の指定、TYPE=GENERALのモデルでも指定できるのだが、そちらは実験版である由。
この新機能と関係していると思うのだが、OUTPUTコマンドにH1MODELオプション、ANALYSISコマンドにH1STARTSオプションが追加された。まだよく理解できていない。
MODEL INDIRECTコマンドの変更。因果推論の観点から定義された直接効果・間接効果が出力されるようになった。こないだ読んだ奴に書いてあった話だ。
INDコマンドで、一番右の変数が連続変数であるとき、その後ろにかっこをつけて比較する2つの水準を指定できるようになった。
媒介変数(メディエータ)があるときの特別な間接効果を出力するMODオプションが追加された。メディエータ、メディエータの水準指定、外生モデレータ、外生モデレータのとる値の範囲、原因変数とメディエータの交互作用変数、外生モデレータとメディエータの交互作用変数、原因変数がとる値の2つの水準の指定、をカバーしている。なにもそこまでしなくても...
潜在クラスモデル・潜在遷移モデルで、二値ないしカテゴリカルな指標の残差共分散を指定できるようになった。ANALYSISコマンドのPARAMETERIZATIONオプションでRESCOVARIANCESを指定する。たとえばMODELコマンドで「%OVERALL% u1 WITH u3;」とだけ指定すると、u1とu3の残差共分散がクラス間等値制約のもとで推定される。さらにクラス別に追記して、あるクラスでだけ残差共分散を自由推定したりできる。そうそう、これ、これまでできなかったんだよな...
連続時間生存モデルの見直し。
まず、VARIABLEコマンドのSURVIVALオプションが変わった。生存時間変数を t として、「SURVIVAL = t;」とすると、従来は定数ハザードが推定されたのだが、改訂後はCox回帰みたいなノンパラメトリック・ベースライン・ハザード関数が推定される。ただし、もし t から連続潜在変数にパスが延びていたり、マルチレベルモデルだったり、モンテカルロ数値積分をするモデルだったりすると、セミパラメトリック・ベースライン・ハザード関数となる。このとき、10個の時間間隔が勝手に決定されるが、「SURVIVAL = t(10);」とか「SURVIVAL = t(4*5 1*10);」という風に時間間隔を明示的に指定することもできるし、「SURVIVAL = t (ALL);」とするとデータ中の時間間隔がすべて用いられる。「SURVIVAL = t (CONSTANT);」とすると定数ハザードになる。
これに伴い、ANALYSISコマンドのBASEHAZARDオプションも変わった。従来は、ONでパラメトリックなベースライン・ハザード、OFFでノンパラメトリックなベースライン・ハザードで、OFFのときのみ、その後ろの(EQUAL)ないし(UNEQUAL)でクラス間等値制約の有無を指定できた。改訂後は、パラかノンパラかではなくて、モデル・パラメータかどうかを指定するためのオプションとなった。デフォルトはOFFで、このときベースライン・ハザード関数のパラメータはモデルのパラメータではなく補助的なパラメータになる。ONにするとモデル・パラメータになり、MODELコマンドで t#1, t#2, ..., [t]が指定できる。またONでもOFFでも、後ろに(EQUAL)ないし(UNEQUAL)を指定できる。
とこのように、同名のオプションの使用方法が変わっちゃったのでややこしい。たとえば単純なCox回帰は、これまでVARIABLEコマンドで「SURVIVAL = t (ALL);TIMECENSORED = tc (0 = NOT 1 = RIGHT);」、ANALYSISコマンドで「BASEHAZARD = OFF;」であったが、改訂後はSURVIVALオプションの(ALL)は不要となり(事情がない限りノンパラになるから)、BASEHAZARDオプションは不要となる。
DEFINEコマンドが微妙に変わったらしい。 ちゃんと読んでないんだけど、たとえば、CENTERオプションのあとで交互作用変数をつくると、これまでは中心化される前の変数が使われたけど、改訂後は中心化された後の変数が使われるようになった、とかなんとか。
DEFINEコマンドなどで使うDOオプションがネストできるようになった。ふーん。
以上!
追記: いやいや、まだ細かい続きがあったのを見落としていた。
- 二値指標でALIGNMENTオプションを使うとき、従来はBAYES推定のみ可だったのが、ML推定も可能になったらしい。
- ML推定でALGORITHM=INTEGRATIONのとき、ブートストラップ標準誤差と信頼区間が表示されるようになったらしい。
- WLS推定でDeltaパラメタライゼーションのとき、TECH4で標準誤差が表示されるようになったらしい。それからTECH4でz検定やp値が表示されるようになったらしい。お、おう... (意味がよく理解できていない。WLSでDeltaって、カテゴリカル指標で多群ってことでしょう? TECH4って潜在変数の要約統計量だと思うのだが... 個々のカテゴリカル指標の裏に仮定されている潜在変数についてSEやpが出るということだろうか。それっていったいどういう意味があるのだろう)
- WLS推定のとき、共変量を伴うモデルで標準化係数と標準誤差が表示されるようになったらしい。(これまで表示されていなかったっけ?)
- プロットの新機能。推定分布とか、中央値・モード・パーセンタイルの推定値とか、個々の残差の散布図とか。
- モンテカルロシミュレーション、TYPE=TWOLEVEL、ESTIMATOR=BAYESのとき、真の因子得点と推定された因子得点の相関やMSEが表示されるようになった、とか... ALIGNMENTオプションを使ったモンテカルロシミュレーションで、真の因子得点と推定された因子得点の相関やMSEが表示されるようになった、とか...(正直、理解できていない。実物を見ないとわからないなあ)
- SAVEDATAコマンドにRANKINGオプションが追加された。ALIGNMENTオプションで実データのとき、RANKINGオプションでファイル名を指定すると、群の因子平均に基づく群のランキングと、因子平均の差の有意性が、CSVファイルに保存されるようになった由。(PISAデータの解析のような状況を想定しているのだろう。ずいぶんマニアックな機能だなあ)
- 識別できないパラメータ名が表示されるようになった (これ、従来はパラメータ番号が表示されていたところで名前が表示され、TECH1と照らし合わせなくて良くなったということかしらん。そりゃ助かる)
- 複数行コメントアウトが可能になった。!*と*!で囲む。(これ、ネストできるのだろうか。SASの/* */みたいにネストできないコメントアウトって、すごく不便だと思うんですよね)
- Mac版のエディタの新機能。
雑記:データ解析 - Mplus 7.2の改訂点