読了: Sterba (2009) 母集団のモデルベース推論とデザインベース推論、そしてその統合

Sterba, S.K., (2009) Alternative model-based and design-based frameworks for inference from samples to populations: From polarization to integration. Multivariate Behavioral Research. 44(6), 711-740.

　仕事の都合で読んだ奴。心理学者のみなさん向けに、model-basedの統計的推論とdesign-basedの統計的推論を統合したアプローチを紹介するというもの。
　なお、本文中には統合的アプローチのためのソフトのレビューをonline appendixで提供していると書いてあるが、見当たらない(本文中のURLはリンク切れ)。Mplusとかが紹介してあったようだ。

　いわく。
　心理学では、観察研究における非確率標本について次の点が問題になってきた。

非確率標本からの統計的推論は可能か。もし可能なら、どんなとき、どんな母集団に対して可能なのか。
非確率標本からの統計的推論は、確率標本の場合と異なるのか。

　1点目については(noと答える教科書もあるが)yesと答える教科書が多い。2点目への答えははっきりしない。

　本論文の目的:

上の2つの質問に答えるため、確率標本・非確率標本からの推論についての新しい２つのフレームワーク(model-based vs. design-based)を提出する。
この2つのフレームワークのそれぞれの限界を、ハイブリッド・フレームワークによって乗り越えることができることを示す。

[脚注にいわく、ここでいう”design-based inference”とは、リサーチデザイン(たとえば回帰不連続デザイン)に基づくという意味ではなくて、標本抽出デザインのみを基盤とするという意味である由。はい、それはふつうそうですよね]

背景: 標本抽出以前
　20世紀初頭まで、標本から母集団への推論を行う統計的なフレームワークというものはなかった。国・州についての社会・医療・経済データは悉皆調査で収集されていた。Kiaer(1895)が非確率抽出を、Bwoley(1906)が確率抽出を提案したが、最初はどちらもフレームワークを欠いていた。
　その後提案されたFisher(1922)のフレームワークはmodel-basedといわれ、Neyman(1934)のフレームワークはdesign-basedといわれた。彼らはいろんな問題について対立したが、以下では彼らの推論フレームワークの前提と論理に注目しよう。

model-based推論フレームワーク
　Fisherは、分布についての想定を置くことで確率抽出を模倣しようと考えた。Fisherにいわせれば、非確率抽出では有限母集団への推測はできない(ここでいう有限母集団とは、すべてのユニットの標本選択確率が0でないという意味である)。しかし無限母集団の推測はできる。そのためには次の3つのステップを踏む必要がある。

統計モデルをつくる。モデルは従属変数がどのように生成されるかを記述する。生成されうる値の集合が仮説的な無限母集団を形成する。
パラメトリックな分布上の仮定を行う。たとえば回帰モデルなら、$\epsilon_i$が$N(0, \sigma^2)$にiidに従う、というのがそれである。この仮定によってはじめて、$y$は標本ユニットの固定的な量であることをやめ、モデルのもとで認識論的にランダムになる。これはデータ収集がランダムであったかどうかとは無関係である。
　このようにFisherのフレームワークでは、アウトカムのランダム変動はデザインではなくモデルによって導入される。実際にランダムに抽出を行わなければならないという前提は、フォーマルには存在しない。そのかわり、モデルによる分布上の仮定が、実際の標本抽出メカニズムに照らしてreasonableでなければならない。たとえばiidという分布上の仮定は、$y$の分布が単純無作為抽出(SRS)で得られる分布と比べて有意味な差をもたない、という主張である。
場合によっては、標本抽出メカニズムはSRSと有意味な違いを持つかもしれない。その場合、モデルをなんらか拡張することで、無限母集団が「主観的に等質で認識できる層別を持たない」ようにしなければならない(これをconditionality原則という)。
- 層別抽出の場合、モデルに層のインジケータを固定効果としていれる。
- クラスタ抽出の場合、モデルにクラスタのインジケータをランダム効果として入れる。
- 不均等抽出(独立変数のもとでアウトカムが選択確率と独立でない抽出)の場合[… 単回帰で、実はデータが$z$で選択されている場合($z$が$x$と相関を持っている or 持ってない), $z$と$zx$で選択されている場合、$y$で選択されている場合、$x$で選択されている場合について述べている。truncated回帰とかが出てくるけど、面倒なのでまるごと省略]。

　いうわけで、このフレームワークでは、問1「非確率標本からの統計的推論は可能か」への答えはyesである。そのためには上記3ステップを踏まなければならない。

心理学におけるmodel-basedフレームワークの実装
　心理学では、上の3ステップのうち3番目が無視されがちである。[研究例…] いっぽう、複雑な抽出特性が実質的仮説と関連していると考えられるときには、研究者はそれを考慮しようとする傾向がある。たとえば、ある測定の因子構造が性によって異なるという実質的な仮定があるときに測定不偏性の検定をするけれど、これは不均等抽出の際に用いられるモデルの特殊ケースとして捉えられる。
　このように、心理学ではconditionality原則が適用されたりされなかったりしているわけだが、その原因はおそらく、非確率標本の分析が統計的基盤に基づいてではなく(予算制約のような)実務的事情で行われているからだろう。[…後略]

design-based推論フレームワーク
　Neyman & Pearson (1933)にいわせれば、仮説的な無限母集団やモデルの構築などというのは主観的で誤りやすい。標本から有限母集団を推測するのはいいけど、それがモデル指定やデザイン変数による条件づけに依存するのは困る。彼らは推論の妥当性をモデルに媒介してほしくなんかない。
　目標パラメータは仮説的な無限母集団のパラメータではない。それは有限母集団のパラメータである。$y$が確率変数になるのは、認識的なランダム性などというもののせいではなくて、無作為抽出デザインによってランダム性が経験的に導入されたからである。順を追って述べよう。

まず、無作為抽出のフレーム・デザイン・スキーマを指定する。フレームとは有限母集団の一次ユニットのリスト、デザインとはフレームの単位に非ゼロの選択確率を付与するもの、スキーマとはデザインを実装したドローのメカニズムである。
既知の選択確率、クラスタや層のインジケータ、そして標本ユニットの観察された$y$の値を使って、有限母集団パラメータとその分散を推定する。[層別クラスタ抽出の場合の合計の推定量とその分散の推定の話。ウェイトを使う。分散推定はテイラー展開による近似解。メモ省略…] 必要なのはウェイトだけであり、分布についての仮定はいらない。

　モデルを指定しないことの欠点は、有限母集団から抽出されたユニットの$y$と、抽出されなかった$y$とかその有限母集団の外側の$y$とかの間に有意味な関連性がないという点である。つまり、可能なのは記述的推論(有限母集団のすべてのユニットが誤差なしに観察されたら推論に不確実性がないような推論)のことである。異なる環境下だったらどんな結果が得られていただろうかという分析的・因果的推論はできない。
　
　いうわけで、このフレームワークでは、問2「非確率標本からの推論と確率標本からの推論は異なるか」への答えはyesである。確率標本のもとでのみ、有限母集団への記述的推論が可能になる。そこでは明示的モデルは要らない。

心理学におけるdesign-basedフレームワークの実装
　design-basedフレームワークは、疫学とか社会学とか医療とか公的統計とか世論調査とかではすぐに普及した。これらの分野では目標パラメータが記述的な量であることが多いし、母集団についてよく知らない状況下で膨大な推定値を得る必要があり、リサーチ・クエスチョンのために仮説的な無限母集団モデルを構築している時間も知識もない。
　いっぽう心理学では、観察研究であっても特定の有限母集団に関心を持つことが少なく、むしろ因果メカニズムの説明と将来の行動の予測のための理論駆動的モデル構築に関心が持たれる。なので、model-basedフレームワークに傾きやすい。

純粋なmodel-basedフレームワークと純粋なdesign-basedフレームワークの限界
　model-basedフレームワークでは、すべての層別変数や選択変数と、それらと独立変数との交互作用をモデルに含めるとモデルがとても複雑になってしまうし、標本選択メカニズムについてよく分かっていない場合は誤りが生じやすい。
　design-basedフレームワークでは、有限母集団の記述的推論に限られ、また目標パラメータのタイプも限られる。さらに、$y$の生成プロセスを明示的にモデル化していないだけで、ウェイト算出の際に、選択確率とアウトカムの関係についての暗黙的なモデルが用いられている。カバレッジや無回答調整においてもそうである。最後に、測定誤差のような標本抽出以外に由来する誤差をフレームワークに取り込めていない。
　[そうそう。design-basedであってもよく考えてみると$y$のモデルが入っているな、と思うわけである。これが私の混乱の原因になっていると思う]

model-basedフレームワークとdesign-basedフレームワークの統合
　70年代以降、ふたつのフレームワークの統合が進んでいる。Chambers & Skinner(2003 書籍), Firth & Bennett(1998 JRSS-B), Kalton(2002 J.OfficialStat.), Sarndal, Swensson, & Wretman(1992 書籍)をみよ。
　統合フレームワークは以下の特徴を持つ。

複雑な抽出デザインのもとで、モデルに抽出デザインの変数をいれることなく、回帰係数のような分析的な統計量をつくれる。
それらの統計量について母集団についての因果的推測も記述的推測もできる。
測定誤差を考慮しやすい。
複雑な抽出デザインの特徴のうち一部だけを条件付けることができる。

　鍵となる展開をいくつか挙げる。

(モデル指定時じゃなくて)モデル推定時に抽出デザインを考慮する。たとえば、無限母集団が$$ y_i = \beta_0 + \beta_1 x_i + \epsilon_i $$ というモデルによって生成されていると想定し、$\beta_1$について分析的/因果的推論をしたいのだが、抽出デザインに不均等選択・層別・クラスタが入っているとしよう。
　Kish & Frankel (1974) いわく、選択変数で条件付けなくても、推定時に調整するだけで、$\beta_1$についての無限母集団推論ができる。$$ \hat{\beta} = (\mathbf{X}^\top \mathbf{X})^{-1} \mathbf{X}^\top \mathbf{y}$$じゃなくて、$$ \hat{\beta}_W = (\mathbf{X}^\top \mathbf{W} \mathbf{X} )^{-1} \mathbf{X}^\top \mathbf{W} \mathbf{y}$$ を使い、$\mathbf{W}$の対角を、ケースの誤差分散の逆数ではなくて、選択確率の逆数すなわちウェイトにすればよいのである。
　Fuller(1975), Binder(1983)いわく、層やクラスタ変数で条件付けなくても、$Var(\hat{\beta})$の推定時に層・クラスタについての調整ができる。通常のWLSでは$$ Var(\hat{\beta}_W) = \hat{\sigma}^2 (\mathbf{X}^\top \mathbf{W} \mathbf{X})^{-1}$$ だが、これを $$ Var(\hat{\beta}_W) = (\mathbf{X}^\top \mathbf{W} \mathbf{X})^{-1} \hat{\mathbf{G}} (\mathbf{X}^\top \mathbf{W} \mathbf{X})^{-1}$$ $$ \hat{\mathbf{G}} = E(\mathbf{X}^\top \mathbf{W} \hat{\mathbf{\epsilon}} \hat{\mathbf{\epsilon}}^\top \mathbf{W} \mathbf{X}) $$ とすればよい。ただし$\hat{\mathbf{\epsilon}}$はモデルから推定された個人ごとの残差である。$\hat{\mathbf{G}}$は独立変数の共分散行列に重み付き残差をかけたもので、モデル化していない選択スキーマについての自動的な調整を行っている。
　このアプローチは線形回帰以外にも拡張できる。また、上のはテイラー展開に基づいているが、ブートストラッピングなどの方法もある。
　[そうか… 調査ウェイトによるWLSというのはひとつの進歩だったのか。私としては、「調査ウェイトでWLSするのは分散推定がおかしくなるからまずい」と考えていたのだけれど、それはソフトがふつうWLSのウェイトとして誤差分散の逆数を想定しているという話であって、WLSというアプローチ自体には問題がないわけだ、なるほど]
無限母集団 and/or 有限母集団についての推論。Fuller(1975), Godambe & Thompson(1986)いわく、ハイブリッド・フレームワークで得られたモデル推定値は、標本サイズも有限母集団サイズも大きいなら、モデルが正しく指定できるかどうかに関わらず、有限母集団パラメータ(たとえばセンサスの回帰係数)の推定値となる。さらに、モデルが正しく指定できていれば、無限母集団パラメータの推定値にもなる。従って、記述的な有限母集団推論はモデルの正しさとはほぼ無関係であり、分析的な無限母集団推論はモデルの正しさにかなり依存する。「かなり」という言い方になるのは、ハイブリッド・フレームワークではウェイティングによってモデルの固定効果の部分についての誤指定に対する頑健性が生じているからであり、分散推定の修正によってモデルのランダム効果の部分についてのご指定に対する頑健性が生じているからである(さらに、固定効果の部分をご指定していても、有限母集団と標本のサイズが大きければ、パラメータのSEは伝統的なデザインベースのSEに接近する)。
測定誤差の考慮。ウェイトの使用と分散推定のデザイン調整は、回帰の最小二乗推定からSEMの最尤推定へと拡張されている。
抽出デザインの一部をモデル推定時に、一部をモデル指定時に考慮する。たとえば、マルチレベルモデルによってクラスタを考慮したい(model-based)、かつウェイトによって不均等選択を考慮し、SEの修正で層別について考慮したい(design-based)、というようなアプローチである。このとき、マルチレベルのレベル2ではクラスタ選択確率の逆数がウェイト、レベル1ではクラスタ選択を所与とした個人の選択確率の逆数がウェイトになる。

心理学におけるハイブリッド・フレームワークの実装　
　ハイブリッド・フレームワークを適用できるのは確率標本だけである。非確率標本の場合は純粋なmodel-basedフレームワークしか使えない。
　[そうかなあ…？これはちょっと視野が狭いのでは。Elliot & Valliant (2017) のいう擬似ランダム化アプローチは、非確率標本によるdesign-basedないしハイブリッドフレームワークですよね。確率標本を参照して非確率標本のユニットの標本選択確率を推定し、ここから擬似的なウェイトをつくり、そこから先は抽出を無視しウェイトのみを使って推論を行う、というようなアプローチ]

　心理学における例を挙げよう。
　[High Schoo and Beyond(HSB)データというのの分析例が紹介されている。このデータは抽出デザインにクラスタも層も不均等選択もある由。抽出デザイン変数をモデルにどこまで入れるかを変えながら複数のモデルを作って比較している模様。面倒くさいのでスキップ]

結論
[略]
——————-　
　この論文を読んだ動機は、題名にmodel-based/design-basedという言葉がはいっているくらいだから、この2つの概念についての厳密な定義と歴史的レビューを与えてくれるかもしれないという点にあったのだが、それに関しては期待外れだった。この論文でいっているmodel-based/design-basedという言葉が、一般的な意味で用いられているのかどうか、よくわからない。
　まあ、勉強になったからよしとしよう。complex sampleの分析に関して、ふだんMplusを使っているせいでなんとなく「そういうものだ」と受け止めていた事柄が、実は70-80年代のブレイクスルーだったのだ、というところが勉強になった。「標本ウェイトを使ったSEMの最尤推定」とか、「回帰モデルの推定で標本ウェイトを使ってWLSをやってよい」「ただし分散推定は通常のWLSとは変わってくる」とか。

読書日記

読んだ本を淡々と記録します

読了: Sterba (2009) 母集団のモデルベース推論とデザインベース推論、そしてその統合