読了:Papies, Ebbes, Van Heerde (2017) マーケティング・モデルにおける内生性という難題

 去年の今頃は諸事情あってマーケティング・ミックス・モデリングのことばかり考えていたのだが、セミナー用資料を作っていてぎりぎりまで悩んだ点のひとつは、内生性に関する話題をどこまで扱うか、という点であった。結局、そういう問題があるんですよという紹介にとどめ、伝統的な伝達関数時系列モデルの定式化と推定に全力を注いだ。虻蜂取らずという言葉もあるし、正しい判断だったとは思うんだけど、いまでもちょっともやもやしている。
 これは私の力量の問題ではなくて(言い訳)… マーケティング効果推定の実務においては、たぶん「内生性のことは触れないのが暗黙のお約束」になっているんじゃないかな、という気がするのである。もちろんアカデミックな文脈では実証研究がいっぱいあるんだけど、実務の文脈においては、あまりに深刻な問題なのにあまりにできることが少なくあまりにしんどいので、視線をそらして見えないふりをしているというか… これは「研究者はきちんとしているが実務家はいいかげん」という話ではなくて、問題解決を取り巻く状況の違いであろう。
 いま試しにgoogleで「マーケティング・ミックス・モデリング」と検索してみたら、業界各社様の華やかな宣伝が目白押しであったが、「マーケティング・ミックス・モデリング 内生性」で検索すると、さっきは何ページめくっても出てこなかった私のしょぼいセミナー資料がいきなり最上位になった。ウケる。

Papies, D., Ebbes, P, Van Heerde, H.J. (2017) Addressing Endogeneity in Marketing Models. Leeflang, P.S.H., et al. (eds) Advanced Methods for Modeling Markets. Chapter 18. Springer.

 これはセミナー準備の際に読みかけた奴。著者はどんな人たちなんだろう、よくわからない。→いま思い出したが、第三著者の論文は読んだことがあった。あ、販促で起きるブランドスイッチングは見た目よか小さいぜ論文もこの人だ。なんだよもう、俺らマブダチじゃん。(でかい態度)

1. イントロダクション
 本章では、内生性(regressorと誤差項に相関があること)という問題とその解決策について議論する。
 本章の重要なテーマのひとつは、内生性が重要な問題であるときにはそれを修正すべきだが、内生性をコントロールしようとしたせいで推定値のバイアスが大きくなったり予測が悪くなったりすることもあるということである。

2. 内生性: 帰結と警告
 市場反応モデルはマーケティング活動が業績に与える効果の推定に焦点を当てる。しかしマネージャーは往々にして、リサーチャーが観察していない変数に戦略的に反応している。計量経済学者風にいえば、マネージャーの意思決定には市場パフォーマンスへの効果の期待に対する内生性があるわけだ。

 ある町にホテルがひとつだけあるとしよう。我々は価格と需要のデータを持っている。しかしその町のイベントのデータは持っていない。ホテルのマネージャーはイベントの時期には価格を上げる。リサーチャーからみると、需要が高くなると価格が高くなるということになる。つまり、需要の誤差項の一部になっている観察されていない要因と、独立変数との間に相関があるせいで、効果の推定値が歪むわけである。
 市場反応を \( y_t \)、価格を \( p_t \) として、説明の都合上誤差は時点を通じて独立だとして、$$ y_t = \beta_0 + \beta_p p_t + \epsilon_t $$ という単純なモデルを考えよう。我々は \( \beta_p \) に関心がある。しかしOLS推定量は \( Cov(p_t \epsilon_t) \neq 0 \) のときにバイアスを持ち、一致性を失う。
 この例では、分析者がもしイベントのデータを持っていれば問題は解決する。しかし残念ながら、ふつうは市場反応の潜在的要因をすべて列挙し測定しモデルに含めることなどできない。
 クロスセクションでも同じ問題が起きる。[略]

 90年代末以降の実証的マーケティング研究において、内生性は最大の問題であった。リサーチャーは因果的な効果を求めているのに、大抵の問題においてリサーチャーは実験ができない、つまりregressorの値を完全にコントロールできないからである。
 内生性バイアスのその大きさと方向は、マネージャーが未知の需要ショックにどう対応するかによって変わる。

  • 価格弾力性の研究についてのメタ分析(Bijmolt et al., 2005 JMR)では、弾力性に効く最大の要因は内生性を無視したかどうかであった(弾力性は負値だが、無視すると0に近づく)。一般にバイアスの符号は無視された変数と説明変数との相関だから、これはマネージャーが需要の正のショックに対して価格を上げるということを意味している。
  • 広告弾力性のメタ分析(Sethuraman et al., 2011 JMR)でも、内生性の無視が弾力性に負の効果を与えた。つまりマネージャーは需要が下がったときに広告を増やす。
  • personal sellingの弾力性のメタ分析(Albers et al., 2010 JMR)では、広告とは逆に、内生性を考慮した研究で弾力性が下がった。[つまり、売れているときのほうが販売員を増やしたりするってことだろう。そりゃそうだろうな]

 ここで重要な警告をいくつか。

  • もし純粋に予測を目的としているならば、内生性は修正しないほうが良い。
  • 「変数を内生変数として扱う」ことと「内生性を修正する」こととは異なる。VAR(X)モデルとかVECモデルとかを組んだからといって内生性が修正できたわけではない。[←ナルホド。ついつい勘違いしそう]

3. 道具変数による推定
 regressorと誤差項との間の相関について強い仮定を置けるなら、もっとも一般的なパラメータ推定方法は道具変数(IV)による推定である。この手法では、独立変数の観察された変動を、外生の部分と内生の部分に分解する。
 さっきのホテルの例のクロスセクションのほうでいうと[メモを省略した奴]、モデルは$$ y_i = \beta_0 + \beta_p p_i + \epsilon_i$$で、\( Cov(p_i \epsilon_i) \neq 0\) なのが問題であった。そこで、モデルに入っていなくて価格をある程度まで予測できる外生変数(道具変数) \( z_i \)を持ってきて、まず $$ p_i = \gamma_0 + \gamma_z z_i + \theta_i $$ を推定する。で\( \hat{p}_i = \gamma_0 + \gamma_z z_i \) を得て、改めて$$ y_i = \beta_0 + \beta_p \hat{p}_i + \epsilon_i$$を推定する。なお両方OLSで推定するのを2SLSという。他にも推定方法がある(後述)。推定は手作業じゃなくて専用のソフトを使うこと。
 ここで必要なのは、(1)\(z_i\)が強い道具変数であること(\(p_i\)と強く関連していること)、(2)\(z_i\)が妥当な道具変数であること(\(\epsilon_i\)と関係していないこと)、である。後者は直接検証できない。

 制御変数(CF)アプローチについて。これは従属変数がカテゴリカルなときとか内生変数の交互作用があるときに使う手法で、もしモデルが線形なら2SLSと同じである。
 まず$$ p_i = \gamma_0 + \gamma_z z_i + \theta_i $$ を推定する、というところまでは2SLSと一緒。次に、\(\hat{\theta}_i = p_i – \hat{p}_i\)として(これを制御変数と呼ぶ)、$$ y_i = \beta_0 + \beta_p p_i + \beta_c \hat{\theta}_i + \epsilon_i $$を推定する。(2SLSのように) \(p_i\)の内生の部分を取り除くのではなく、内生の部分をコントロールしようとするわけだ。
 2SLSと同様、\(z_i\)が強くて妥当であることが必要。なお、\( \hat{\beta}_p \)のSEはブートストラップ法で求める。

 同時方程式アプローチについて。$$ y_i = \beta_0 + \beta_p p_i + \epsilon_i$$ $$ p_i = \gamma_0 + \gamma_z z_i + \theta_i $$ を同時推定する。誤差項はMVNと仮定する(LIML推定量となる)。この方法の弱点はMVNという仮定で、これを緩和するという提案もある[Stataのことが書いてある… そんなん書かれても…]
 上の同時方程式をベイズ推定するという手もある。誤差項の分布についてなんらかの仮定が必要。
 店舗の類似性とか空間的近接性とかを入れる方法もある…[メモ省略]。
 [OLS, 2SLS, CF, LIMLを簡単なシミュレーションで比較。OLS以外は大差ない]

 IV推定値の一致性はひとえにIVの強さと外生性によって決まる。次の3段階を踏むのが良い。

  1. 候補変数の強さを調べる。弱い候補変数はむしろ入れないほうがましなことがある[シミュレーションを示している。略]
     強さの判断において一番大事なのは、データがどうやって得られたかの理解である。理論が大事なわけだ。
     強さをフォーマルに調べる方法もある。たいていは、\(p_i\)の\(R^2\)が\(z_i\)によってどれだけ増えたかを測る。F検定を使うことが多い。説明変数が複数あるときは、バラバラにF検定するんじゃなくて多変量F検定を使う。道具変数を入れる前の\(R^2\), 入れた後の\(R^2\), (正しく求めた)F値の増分を報告するように。
  2. 残った候補変数の外生性を調べる。内生的な候補変数は入れないほうがましである[シミュレーション。略]
     ここでも理論が大事である。IVあるところ理論あり。多くの場合、マーケティング・モデルにおける外生性問題は欠損変数の問題だと捉えると便利である。ホテルの場合でいえば、需要と価格の背後にある観察されていないプロセスについて記述してみると良い。
     場合によっては過剰識別検定が役に立つこともある。第二段階の回帰式の残差は道具変数と相関を持たないはずだから、\(\hat{\epsilon}_i \)をすべての道具変数(とすべての外生のregressor)に回帰する。で、その\(R^2\)にケース数を掛けた値がカイ二乗分布に従うかを調べる(「候補変数が外生だ」が帰無仮説になる)。これをSargan検定とか、(ちょっとちがうけど)HansenのJ検定とかと呼ぶ。この検定に頼らないように。理論のほうがはるかに大事である。
  3. 内生性の存在を調べる。つまり、修正してないパラメータ推定値と内生性を修正したパラメータ推定値を比べる。これをHausman検定とかDurbin-Wu-Hausman検定という。なお、ここで\(R^2\)を使うのは間違い。2SLSは残差平方和を最小化していないから。これはout-of-sampleについてもそうで、OLSのほうがよくfitするはずである。fitを比較してよいのは、理論的には妥当性が等しい2つの内生性修正アプローチを比べるときだけである。

 最後に、道具変数の候補をどこから探してくるのかという問題について。いくつかのソースを挙げる。

  • ラグ付き変数。
     ただし、これはあまりお勧めしない。たとえば販促と買いだめが共起するとき、ラグ付き価格を道具変数にするのはおかしい[過去の価格は現在の価格に効くけど買いだめ経由で需要にも効く、という話だろう]。それに、ラグ付き価格は参照価格の形成に関わるかもしれない。ラグ付きregressorが妥当な道具変数になるのは未知の需要ショックが今期に限定されているときだけである。これは多くの場合現実的ではない。
     使うのは、IVとしての強さと外生性を理論的に主張できるときだけにしておくこと。ラグを数期以上とるか、ラグ付きregressorが現在の需要に影響するメカニズムをモデルに陽に含めるのが良い。世帯の買い置き数を測定するとか。
     [ここ、ちょっと集中力が途切れたので全訳]

    ラグ付きregressorをIVとするとき、その妥当性を正当化するため、関連するメカニズムを需要モデルに陽に含めるべきである。この一般的原則は、関連するメカニズムがモデルで表現できるものであるかぎり、他の場合にも当てはまる。たとえば、広告はブランド・エクイティを通じて需要に影響し、かつ需要に対する直接効果も持つ。仮に、広告のこの動的効果の全体がブランド・エクイティを経由し、需要の誤差項は自己相関を持たないとしよう。さて、我々は需要を広告とブランド・エクイティに回帰するモデルを推定することで、広告の潜在的な内生性を説明したい。ここで我々はこう論じることができる。私たちはラグ付きの広告(つまりブランド・エクイティ)が需要に影響するというメカニズムをモデルに含めました。ですから私たちはIVの妥当性への脅威である欠損変数の問題を解決しているのです。従って、IVは需要の誤差項とほとんど相関を持たないでしょうし、従って現在の広告に関する妥当なIVとなるでしょう。

  • コスト。価格に内生性があるとき、その道具変数としてコストを使うことが多い。
     ここで警告をふたつ。(1)コストは観察が難しいことが多い。(2)小売が設定した価格に内生性があるとして、実はメーカーも観察されていない需要ショックについて知っていて、それに応じて卸価格を決めているのかも知れない。たとえばメーカーもキャンペーンに参加しているとか。[他にもいくつか例が挙げられている。要するにコストだって内生的かもよってことね]
  • 異なる市場・産業・ブランド。
     たとえば、価格に内生性があるとき、その道具変数として別の市場の価格を使うことがある。いまどきはコスト構造が異なる市場間で共通していることが多いので、こういうのも成り立つ。ただし、観察されていない需要ショックの方も市場間で共通かもしれないという問題がある。

4. パネルデータ
 パネルデータによる内生性の検討は、道具変数を探すのなんかより全然有望である。
 週\(t\), ホテル\(i\)について $$ y_{it} = \beta_0 + \beta_p p_{it} + \alpha_i + \lambda_t + \epsilon_{it} $$ と考えよう。パネルデータなら\( \alpha_i, \lambda_t \)の内生性は除去できる。
 \( \alpha_i \)に観察されていないコンポーネントが含まれている場合について考えよう[ホテルレベルの残差が価格$\p_{it}$と共通の親を持つってことね]。\( \alpha_i \)を固定効果として推定してしまえばよい。ホテルがいっぱいあるときは、需要と価格をホテル別に平均して $$ \bar{y}_i = \beta_p \bar{p}_i + \alpha_i + \bar{\epsilon}_i $$ と考えて、$$ (y_{it} – \bar{y}_i = \beta_p (p_{it} – \bar{p}_i) + (\epsilon_{it} – \bar{\epsilon}_i) $$ を推定すればよろしい。これは、マネージャーが価格を決める際に考慮している観察されていない需要ショックが時間変動しないという仮定に基づいている。
 なお、\( \alpha_i \)をランダム効果と捉えた場合は内生性は説明されないし、識別のためにはふだんよりさらに強い外生性の仮定が必要になる。Germann et al (2015 J.Mktg)をみよ。[←うおおおお。そうなのか]
 [ここからシミュレーション。{時間ショック、クロスセクショナルショック、その両方、交互作用あり}の4つのシナリオについて、{OLS, 2SLS, 時間効果を固定効果としたOLS, クロスセクショナルな個体差を固定効果とみたモデル、さらに時間の固定効果を加えたモデル、クロスセクショナルな個体差をランダム効果と捉えたモデル、さらに時間の固定効果を加えたモデル}を比較。時間ショックだけだったら時間の固定効果だけ加えればよい(2SLSにしないほうがよい)。クロスセクショナルショックだけだったら2SLSかクロスセクショナル固定効果モデルがよい。両方だったらクロスセクショナル固定効果+時間固定効果が良い(へええええ)。交互作用があるときは2SLSが良い。まとめていうと、道具変数を使うのがよいのは、外生性がパネルデータ構造の一番下のレベルで起きていたときだけ、だそうな]

5. IVフリーな手法
 観察されたIVを使わない方法を2つ紹介しよう。

 その1, 潜在道具変数(LIV)アプローチ。Ebbes et al.(2005)が提案した。
 内生変数を内生誤差と外生情報(つまり潜在道具変数)とにわけるという発想は同じなんだけど、道具変数を観察する代わりに内生誤差と潜在道具変数との同時分布について仮定する。
 Ebbesらは離散の潜在変数を考えた。$$ y_i = \beta_0 + \beta_p p_i + \epsilon_i$$ $$ p_i = \pi \tilde{z}_i + v_i $$ \(\pi\)は\(1 \times L\)のベクトルで潜在カテゴリの平均、\( \tilde{z}_i \)は\(L \times 1\)のベクトルで潜在カテゴリの確率(0より大、合計1)。[ちょ、ちょっとまって… 価格の平均はちがうけど需要の分布は変わらないL水準の潜在クラスがあって、個々のケースがどのクラスに属するかはわからん、ってことね?]
 で、\(v_i\)は\(\epsilon_i\)と二変量正規分布すると考える。このモデルは正規混合モデルになってML推定できる。
 実証研究の例: Abhishek et al.(2005, MktgSci), Grewal et al.(2010 JMR; 2013 JMR), Lee et al.(2015 MkgtSci), Ma et al.(2014, MgmtSci), Narayan & Kadiyali (2015 MgmtSci), Rutz et al.(2012 JMR), Ruts & Trusov (2011, MktgSci), Saboo & Grewal(2012 MktgSci), Sonnier et al.(2011 MktgSci), Zhang et al.(2009 JMR), ほか。[やだもう、いっぱいあるわ]
 LIVをうまく使うには以下が必要だ。(1)伝統的なIVと同じく、理論が大事。(2)LIVによるパラメータ推定とOLSを比べて、差が理論にあっているかどうか調べること。(3)\(L\)は少なくとも2から5くらいまで全部ためすこと。(4)\(\epsilon_i\)の正規性を確認すること。(5)内生regressorの非正規性を確認すること。
 シミュレーションしてみよう[…力尽きた。パス]

 その2, ガウシアン・コピュラ。Park & Gupta (2012)が提案した。
 \(p_i\)の累積分布を\(H(p)\)とし、逆正規CDF \( p^* = \Phi^{-1}(H(p))\)を求める。で、制御変数アプローチのように$$ y_i = \beta_0 + \beta_p p_i + \beta_c p^*_i L + \epsilon_i $$と考える。\(\beta_p\)はOLSで一致推定できる。ただしSEはブートストラップ推定すること。
 [神よ、なぜそうなるのかさっぱり理解できません… いったいなにを云っているのでしょうか…]
 この手法の最大の欠点は、内生変数が非正規だという仮定が必要だということ。正規分布に近いとうまくいかない。さらに、誤差項が正規だという仮定も要る。
 [簡単なシミュレーションをしている。パス]

6. IV推定の発展的話題

内生regressorが複数あったらどうするか
 たとえば\(p_1, p_2\)があったら、第一段階では2本推定することになる。道具変数は最低2つ必要(「\(z_1\)だけが\(p_1, p_2\)の両方と相関してて\(z_2\)は両方と無相関」とか「\(p_1\)だけが両方と相関してて\(p_2\)は両方と無相関」というのはだめ)。[このあとも説明が続くけど… いいや、必要にあったら読もう]

交互作用項
 たとえば価格\(p_1\)の効果が季節ダミー\(w\)で変わるとして、$$ y = \beta_0 + \beta_1 p_1 + \beta_2 + \beta_3 p_1 w + \epsilon_1 $$ と考えたとしよう。このときIVアプローチなら\(p_1 w \)は別の内生regressorだと考えて、$$p_1 = \gamma_0 + \gamma_1 z_1 + \gamma_2 w + \gamma_3 z_1 w + \theta_1$$ $$ p_2 = \eta_0 + \eta_1 z_1 + \eta_2 w + \eta_3 z_1 w + \theta_2$$とする。制御変数アプローチなら$$p_1 = \gamma_0 + \gamma_1 z_1 + \gamma_2 w + \theta $$として、第二段階の式に\( \hat{\theta} \)を追加する。制御変数アプローチのほうがかんたん。[←へえええ… 面白いけどいまいちぴんとこない、あとで考えよう]

二乗項
 モデルが$$y = \beta_0 + \beta_1 p_1 + \beta_2 p_1^2 + \beta_3 w + \epsilon_1$$であるとき、第一段階で\(p_1\)の回帰式を推定するのは間違い。これを「禁止された回帰」と呼ぶ[←へー]。正解は以下のいずれか:

  1. \(p_1\) と\(p_1^2\)を別の変数と捉えて以下の2本を推定する。$$p_1 = \gamma_0 + \gamma_1 z_1 + \gamma_2 z_1^2 + \gamma_3 w + \theta_1$$ $$p^2_1 = \eta_0 + \eta_1 z_1 + \eta_2 z_1^2 + \eta_3 w + \theta_3$$
  2. 以下の2本を推定する。$$p_1 = \gamma_0 + \gamma_1 z_1 + \gamma_3 w + \theta_1$$ $$ p_1^2 = \eta_0 + \eta_1 z_1 + \eta_2 \hat{p}_1^2 + \eta_3 w + \theta_2$$
  3. \(p_1^2\)の項を交互作用項と捉え、第一段階では$$p_1 = \gamma_0 + \gamma_1 z_1 + \gamma_3 w + \theta_1$$ を推定し、第二段階では式に\( \hat{\theta}_1 \)を追加する。

[いまいちよくわからんが、必要になったら考えよう…]

二値・カテゴリカルな内生regressor
 二値の内生変数\(d_1\)があり、モデルが$$ y = \beta_0 + \beta_1 d_1 + \epsilon$$だとしよう。以下の手が考えられる。

  1. 単に2SLS推定。そもそもIVの分布についての仮定はないので、間違ってはいないのだが、効率が悪い。
  2. まずプロビット回帰$$ P(d_1 = 1) = \Phi(\eta z)$$を推定する。予測された確率を\(d_1\)の道具変数とみて$$d_1 = \delta_0 + \delta_1 \hat{P}(d_1 = 1)$$を推定する。予測された値を\(y\)の式にいれて$$y = \beta_0 + \beta_1 \hat{d}_1 + \epsilon_1$$を推定する。\(\hat{P}(d_1 = 1)\)をそのまま使わないところがポイント。[←へええ!面白いなあ]
  3. 最初のプロビット回帰で一般化残差を求めてこれを制御関数としていれる。[式をみてもさっぱり意味がわからないのでメモ省略]
  4. 最初のプロビット回帰でプロビット残差を求めて、これを制御関数としていれる。two-stage residual inclusion(2SRI)という。[これもメモは省略でいいや…]

選択モデル
 二値の内生変数\(y_2\)があり、これが1のときだけ\(y_1\)が観察されるとしよう。$$y_1 = \beta_0 + \beta_1 w_1 + \epsilon_1$$ $$y_2 = 1 | \delta_0 + \delta_1 w_2 + \eta_2$$ この場合は、まずプロビット回帰$$P(y_2 = 1) = \Phi(\delta_0 + \delta_1 w_2 ) $$を推定し、逆ミルズ比 $$\hat{\lambda} = \phi(\hat{\delta}_0 + \hat{\delta}_1 w_2) / \Phi(\hat{\delta}_0 + \hat{\delta}_1 w_2)$$を求める(\(\phi\)は標準正規分布のPDF)。で、$$y_1 = \beta_0 + \beta_1 w_1 + \beta_2 \hat{\lambda} + \epsilon_1$$をOLS推定する。

制約付き従属変数
 すなわち、従属変数がカテゴリカルだったり割合だったりトランケートされてたりする場合。この場合は制御関数アプローチがおすすめ。たとえば、ブランド選択が従属変数で価格が内生regressorだとしよう。$$Utility(brand \ j)=\beta_{0j} + \beta_1 p_j + \epsilon_j$$この場合、まずは標準的なIVと同じく第一段階 $$p_j = \gamma z_j + \theta_j$$を推定し、残差\(\hat{\theta}_j = p_j – \hat{\gamma} z_j\)を求めて、これを上の効用関数に叩き込む。\(p_j\)の式は\(\epsilon_j\)がMVNだと仮定するならプロビット回帰、極値分布と仮定するならロジットモデルとなる。[←??? 効用関数の式は、の間違いではなかろうか]

7. 考察
 内生性の問題は、査読者が論文をリジェクトするための手がかりとして用いられることが多い[←はっはっは]。内生性はのどに刺さったとげのような問題である。

  • まずregressorの分散のどの側面が内生的でありうるかを注意深く考えること。マーケティングでは内生性の問題は欠損変数に由来することが多い。どんな情報が欠損しているのかを考え、データ収集と制御変数の追加に全力を注ぐこと。冒頭のホテルの例でいえば、いきなりIVとかIVフリーな手法とかに飛びつくのではなくて、まずその町のイベントのカレンダーとか、トリップアドバイザーのホテル品質評価とかを探しなさい。
  • パネルデータなら、企業の意思決定に影響している固定効果を探しなさい。クロスセクショナルな個体差とか、季節とか。
  • どんな内生性がありえて、そのためにどんな制御変数を入れたのか、を明確に述べなさい。
  • 内生性を指摘するだけなら簡単だがinvalidateするのは難しい。査読者はそれが実質的な問題だということを述べなさい。気軽に指摘すりゃいいってもんじゃない。[←ちょっと笑っちゃった。著者の先生は投稿者として辛い思いをしたことがあるんじゃなかろうか]

 IVで推定した係数の解釈について。それは必ずしも因果的効果ではないことに注意せよ。それをATEとみなすためにはすべての単位が道具変数に同じように反応するという仮定が必要である。実際には、ホテルの例でいうと、価格をコストで決めているホテルもあればそうでないホテルもあるだろう。
 ここまでお読み頂いた方の中には、そもそもIVなんて使うのは止めた方がいいんじゃないかと思う人もいるかもしれない。IVの強さと外生性という要請は本質的には両極に位置する要請だ。いっぽう、LIVやガウシアン・コピュラが前提にしている条件も厳しい。結局、ある想定(例, 独立変数と誤差は無相関)を別の想定(道具変数は誤差と無相関)に置き換えただけなのだ。

 レポートにおいては、次の3点を明示すること。(1)ありうる内生性問題はなにか。それを避けるために含めた制御変数はなにか。(2)内生性問題はまだ残っているか。(3)残っているなら、IVアプローチなりIVフリーアプローチを試す。できれば両方試すと良い。IVアプローチの場合、IVを正当化する論拠を示す。過剰識別の場合はSargan検定ないしHanssenのJ検定を行うとよい。IVの強さを適切な統計量で示すこと。最後にHausman検定を示すこと。有意でなかったら内生性は修正しない方が良い。IVフリーアプローチの場合は分布上の仮定について検討すること。
 [スタートから論文執筆までのフローチャートが描いてある]
 
 最後にソフトウェアの話。Rだとivmodel, ivpack, tosls, ivpane, ivfixed, ivprobit, ivbmaなどのパッケージがある。[Stata, Matlab, GAUSSの話も書いてあった]

 …やれやれ、やっと終わった。
 ずっと前にAntonakis et al.(2010)という長いレビュー論文を読んだときも思ったんだけど、内生性の問題になると、専門家の方は強烈に2SLS推しになるんですよね。今回もちょっとびびった。心理学では2SLSなんて使わないし…。MVNを仮定して同時方程式をML推定すればいいんじゃないでしょうか… だめですか…。
 最近ではIVを使わない方法もあるらしいし、と期待していたのだが、LIVというのもガウシアン・コピュラというのも、分布の非正規性というなんだかめっさ強い仮定が要るようで… うまい話はそうそうないもんだね。

 素朴な疑問:内生性修正がパラメータ推定に与えた効果を知りたいとき、OLSと2SLSのあいだで決定係数を比べるのはナシだというのはわかったんだけど、道具変数をSEMにいれて同時推定する場合(要するにMplusで片づけたいんです)、道具変数を入れたモデルと入れなかったモデルをAICとかで比較するのはアリなんだろうか。たぶんそれもナシなんだろうな。いやこれ、絶対どっかで読んだ話だ… にわとりのような記憶力…