elsur.jpn.org >

« 読了:Morris (1974) 専門家の意見を用いたベイジアン決定モデル | メイン | 読了:Bordley (1982) ベイジアン合意モデル »

2016年4月 3日 (日)

Winkler, R.L. (1981) Combining probability distributions from dependent information sources. Management Science, 27(4), 479-488.
 80年代のベイジアン合意モデル研究として、よく引用されている論文。

 いわく。 
 異なる情報源から得られた推定や予測(これを「専門家」と呼ぶ)から、どうやってひとつの値(「合意」)を得るか。ここでポイントになるのは、専門家のあいだに確率的(stochastic)な依存性があるかもしれないということ。これは先行するベイジアンモデルであるMorris (1977, MgmtSci.)なんかがあまり注目してこなかった点だ。

 関心ある変数$\theta$の分布について$k$人の専門家が評価するとしよう。話の都合上、$\theta$は実数、$k$個の予測分布はみんな連続とする。専門家$i$の密度関数を$g_i$とする。その平均
 $\mu_i = \int \theta g_i (\theta) d\theta$
を$\theta$の点推定値とみることができる。誤差を
 $u_i = \mu_i - \theta$
と書く。誤差の密度を$g_i (\mu_i - u_i)$と書く。
 意思決定者から見た$\vec{u} = (u_1, \ldots, u_k)^t$の密度関数を$f$とする。意思決定者の立場からは、$\theta$についての知識は$\vec{u}$の密度関数を変えないと想定する。つまり、$f$の関数形は$\theta$や$\vec{\mu} = (\mu_1, \ldots, \mu_k)^t$に依存しないと想定する。なお、この想定は緩めてもよい(話がややこしくなるけど)。
 意思決定者は$\theta$の事前分布を持っていて、専門家の意見によってそれを更新し事後分布を得る。ここで、$f(\mu_1 - \theta, \ldots, \mu_k - \theta)$を尤度関数とみることができるから、事前分布を$h_0(\theta)$とすれば、事後分布は
 $h(\theta | g_1, ..., g_k, f, h_0) \propto h_0(\theta) f(\mu_1 - \theta, \ldots, \mu_k - \theta)$

 さあ、準備はできた。$f$をどうやって決めるか。
 ここでは、$f$は$k$変量正規分布で、平均はすべて$0$、共分散行列$\Sigma$は正定値行列だ、と仮定する。この仮定が無理めな場合でも、適切なキャリブレーションによってこれに近づけることができるんとちゃいますかね。

 $\Sigma$が既知であるとしよう。
 $\theta$について拡散事前分布を想定すると、事後分布はこうなる。$1$の縦ベクトルを$\vec{e}$とし、
 $\mu^* =\vec{e}^t \Sigma^{-1} \vec{\mu} / \vec{e}^t \Sigma^{-1} \vec{e} $
 $\sigma^{*2} = 1 / \vec{e}^t \Sigma^{-1} \vec{e} $
として、標準正規密度関数を$\phi$として、
 $h(\theta | \vec{\mu}) \propto \phi[(\theta - \mu^*) / \sigma^*]$
 具体的に言うとこうだ。事後分布の平均は、個々の$\mu_i$の重み付け和 $\sum_i^k w_i \mu_i$となり、重みは共分散行列の逆行列 $\Sigma^{-1} = (\alpha_{ij})$を縦に足し上げた値に比例させた合計1の重み
 $w_i = \sum_j^k \alpha_{ij} / \sum_m^k \sum_j^k \alpha_{mj}$
となるわけである。相関が高いときは重みが負になっちゃっても全然おかしくないという点に注意。
 [数値例。省略]
 $k$が大きくなると$\Sigma$を与えるのが大変になるので、相関行列の非対角成分が全部同じ、という制約をかけて考えると...[略]

 $\Sigma$が未知である場合。
 $\theta$と$\Sigma$はアプリオリに独立だと想定します。$\theta$には拡散事前分布を想定します。$\Sigma$には逆ウィシャート事前分布を与え、ハイパーパラメータを$\delta_0, \Sigma_0$とします。。[...中略...]事後分布は$t$分布となり、自由度は$\delta_0+k-1$、平均は
 $m^* = \vec{e}^t \Sigma_0^{-1} \vec{\mu} / \vec{e}^t \Sigma_0^{-1} \vec{e}$
分散は[...省略]。事後分布の平均をよくみると、$\Sigma$が$\Sigma_0$にすり替わっただけであります。
 [数値例。省略]

 。。。なるほどねえ。ベイジアン合意って、もともとこういう枠組みだったのか。この論文をもっと早く読んでおけばよかったな。

 ところで、わからないところを検索していてうっかり見つけてしまったのだけれど、この論文の内容について、言い回しや数値例まで含めほぼ逐語的であるとさえいえる、解説というかなんというか、を提供している日本語の紀要論文があった(美しい表現)。人によって見方が分かれるところかもしれないが、そういうのもアリなんじゃないか、と、これは本気で思う。非専門家としては、誰かに日本語にして頂けるだけで助かります。さらにいえば、いま自分が調べていることがほんとに誰かの役に立つ話なのか、だんだん不安になってきていたところだったので、その意味でもほっとした。

論文:データ解析 - 読了:Winkler(1981) ベイジアン合意モデル (正規性仮定バージョン)