読了: Sigmund & Ferstl (2019) パネルVARモデルのRパッケージpanelvar、その全内幕

Sigmund, M., & Ferstl, R. (2019) Panel vector autoregression in R with the package panelvar. The Quarterly Review of Economic and Finance.

パネルVAR(ベクトル自己回帰)モデルのためのRパッケージpanelvarの解説。先日、仕事で使おうかなと思う用事があったので、試しにめくった次第。もちろん細かいところは全然理解できていない。

1. イントロダクション
 動的パネルデータで、クロスセクションの次元\(N\)が大きくて時間次元\(T\)が小さいときにどうするか。古典的なOLS回帰は使えない。Nickellバイアスというのがあって、\(T\)が固定の時\(N \rightarrow \infty\)でも消えないからだ。[最初のパラグラフから知らない話が出てきて心がくじけそう]
 GMM推定量っていうのがある。1階差分GMM推定量とシステムGMM推定量がある。前者は外生変数のラグを道具変数として使い、後者は「レベル」に含まれている情報に基づき積率条件を追加する。Rだとplmパッケージが実装している。しかし、それらはふつう単一方程式の動的パネルデータモデルに焦点を当てている。いっぽう多くの応用では同時方程式が必要になる。
 Sims(1980)以来、経済学においては外生変数が複数あるモデルの初手はVARであり、パネルVARもめっちゃ普及している。わしらはSTATAでxtabond2というのを作って広く使われておる。それを拡張したRパッケージpanelvarをつくったよ。直交インパルス応答関数、一般化インパルス応答関数、予測誤差分散分解も載せたよ。Hanseの過識別検定、モデル選択手続き、とかとかも載せといたよ。

2. 方法論
2.1 拡張PVARモデル
 わしらが考えとるモデルは固定効果の定常PVARモデルじゃ。個体\(i\)の時点\(t\)の内生変数ベクトル(長さ\(m\))を\(\mathbf{y}_{i,t}\)として、 $$ \mathbf{y}_{i,t} = \mu_i + \sum_{l=1}^p \mathbf{A}_l \mathbf{y}_{i,t-l} + \mathbf{B} \mathbf{x}_{i,t} + \mathbf{C} \mathbf{s}_{i,t} + \epsilon_{i,t} $$ [おっとー。単一個体のモデルとしてはVARX(p)モデル、つまりVAR(p)モデルの右辺に外生変数が直接入っているモデルになっている(線形モデルの攪乱項がVAR(p)だよという話ではない)。外生変数は\(\mathbf{x}\)と\(\mathbf{s}\)に分かれていて、そこについての説明がこれからある。個体間で異なる係数は切片項のみ。脚注に書いてあったが固定効果とみなすそうだ。てっきりランダム効果にするものなのかと思っていたよ、これじゃあ個体数が多くて時点数が少ないデータは辛そうだな]
 \(\mathbf{x}_{i,t}, \mathbf{s}_{i,t}\)は長さ\(k, n\)のベクトルで、前者は過去の誤差と相関していていいけど、後者は厳密に外生でないといけない。\(\epsilon_{i,t}\)はすべての\(i, t\)でiidで、平均0, 分散\(\Sigma_{\epsilon}\)。\(\mathbf{A}\)のすべての単位根は単位円の内側に落ちており、よって共分散定常であるとする[難しくってよくわかんないんですが、ARモデルの定常性条件のVAR版みたいのを満たしているといってんでしょうね]。
 とこのように、PVARモデルとは、単一方程式動的パネルモデル(DPM)とVARの組み合わせなのじゃ。

 [次の節からは推定量とその分散推定の話になると思うので、著者の先生方には大変申し訳ねえのだが、読まずにスキップ。読んだところで理解できないという確信がある。見出しのみメモする]

2.2 一階差分積率条件
2.3 一階差分積率条件の数についてのノート
2.4 一階差分積率条件を伴うGMM推定量
2.5 システム積率条件
2.6 システムGMM推定量
2.7 推定量の漸近共分散行列の推定

2.8 直交化インパルス応答分析
 ある内生変数におけるインパルスに対する他の内生変数について考える。まず、PVAR-X(1)過程をPVMA-X(パネル・ベクトルMA表現)で書いて $$ \mathbf{y}_{i,t} = \nu_i +\left( \sum_{j=0}^{\infty} \mathbf{A}^{j-1} \left[ \begin{array}{cc} \mathbf{B} & \mathbf{C} \end{array} \right] \right) \left[ \begin{array}{c} \mathbf{x}_{i,t-j} \\ \mathbf{s}_{i,t-j} \end{array} \right] + \left( \sum_{j=0}^\infty \mathbf{A}^j \right) \left[ \mathbf{\epsilon}_{i,t-j} \right] $$ ここからインパルス応答関数が得られる。\(\epsilon\)の\(r\)番目の要素へのショックの\(k\)期あとの反応は: $$ IRF(k,r) = \frac{\partial \mathbf{y}_{i,t+k}}{\partial (\epsilon_{i,t})_r } = \mathbf{A}^k \mathbf{e}_r $$ \(\mathbf{e}_r\)は長さ\(m\)のベクトルで、\(r\)列目にだけ1、あとは0がはいっている。
 [あらま。パネルVARのIRFって意外にストレートに出てくるのね。もっと超絶ややこしい話になるのかと思った。個体の異質性は切片項だけなんだから当然か…]

 実際には、共分散行列\(\Sigma_\epsilon\)の対角成分は0でないので、独立なショックに対してどうなるかということを考えないといけない。直交化IRFはこうなる…[略]。途中でこれスキー分解したせいで変数の順番が効いてきてしまう。その対応策は次節で。

 さて、IRFができるんなら予測誤差分散分解(FEVD)はどうなるかというと…[略]

[ここからまた難しくなるのでスキップ…]
2.9 一般化インパルス応答分析
2.10 インパルス応答分析の信頼バンド
2.11 specification 検定 [全然知識がなくてついていけないのだが、道具サブセットの妥当性のHansen過識別検定、Andrews-Luモデル選択手続き、PVARモデルの安定性、というのが載っている]

3. panelvarパッケージの適用
[数値例。こちらはRをいじりながら読んだのでメモは省略し、見出しのみメモする]
3.1 panelvarを使った動的パネル推定
3.2 panelvarを使ったパネル自己回帰
3.3 Stataのpvarとの比較

4. 結論
[略]
—————
世の中には… 決して理解できないものがある… 一生かかっても手が届かないものが… それがパネルVARモデルのGMM推定量だ… (難しくてわからんかったという感想の言い換え)