購入頻度が負の二項分布に従うと考えられているのはなぜか

 消費者パネルの購買データを真夜中にコリコリと集計しながらあれこれ考えていて、なんだか混乱しちゃったので書いたメモを載せておく。

 よく、顧客の月あたり購入回数の分布は負の二項分布に従う、とかっていうじゃないですか。いかにも「そんなの常識ですよね」というような顔で。頭のいい人のそういうとこ、まじでむかつく。
 というわけで、以下、自分向けの易しい説明である。

 ある出来事をランダムに、平均して単位期間あたり\( \lambda \)回起こす人が、その出来事をある単位期間中に起こす回数を、確率変数\(X\)としよう。この変数はポアソン分布 $$ P(X = x | \lambda) = \frac{\lambda^x \exp(-\lambda) }{ x! } $$ に従う。
 たとえば平均して月に1回なにかを買う人がいたとして、その人が今月それを2回買う確率は $$ P(X = 2 | \lambda = 1) = 1^2 \exp(-1) / 2! = 0.37 / 2 = 0.18$$ となるわけですね。

 実際には、\( \lambda \)は人によってちがう。その分布としてガンマ分布 $$ g(\lambda | r, \alpha) = \frac{\alpha^r \lambda^{r-1} \exp(-\alpha \lambda)}{\Gamma(r)}$$ を想定する。\(r (> 0)\)は形状をあらわすパラメータで、1のとき指数分布になり(確率密度関数は \(\lambda\)とともに単調減少となり)、1より大きいとき確率密度関数は山型になる。\(1/\alpha (> 0)\)は尺度をあらわすパラメータで、大きいとき右に寄る。\(\lambda\)の平均は\(r / \alpha\)となる。分母にガンマ関数\(\Gamma(r)\)というのがはいっているけど、それは当面どうでもよい。

 ある人が\( \lambda \)を持ち、かつ出来事を\( x \)回起こす確率は、この2つの確率の積になる。すなわち$$ P(X = x | \lambda) g(\lambda | r, \alpha)= \frac{\alpha^r \lambda^{x+r-1} \exp(-(\alpha+1)\lambda)}{x! \Gamma(r)} $$ さて、\( \lambda \)の如何を問わず、ある人が出来事を\( x \)回起こす確率を求めたい。そこで、上の式を\(\lambda\)について積分する。$$ P(X = x | r, \alpha) = \int^\infty_0 \frac{\alpha^r \lambda^{x+r-1} \exp(-(\alpha+1)\lambda)}{x! \Gamma(r)} d\lambda$$ ここから数学の得意な奴が好きそうな悪巧みがはじまる。そうそう、高校の頃にこういうのが好きな同級生がたくさんいたよ。俺は心が清らかなので早々に諦めたけど。
 まず\(\lambda\)と関係ない奴を左側に出すじゃないですか。
$$ = \frac{\alpha^r}{x!\Gamma(r)} \int^\infty_0 \lambda^{x+r-1} \exp(-(\alpha+1)\lambda) d\lambda$$ でもって、積分記号の中に\(\frac{(\alpha+1)^{x+r}}{\Gamma(x+r)}\)を掛けて外で割り戻すわけ。$$ = \frac{\alpha^r}{x!\Gamma(r)} \frac{\Gamma(x+r)}{(\alpha+1)^{x+r}} \int^\infty_0 \frac{(\alpha+1)^{x+r} \lambda^{x+r-1} \exp(-(\alpha+1)\lambda)}{\Gamma(x+r)} d\lambda$$ 積分記号の内側について\(q = x+r, \beta = \alpha+1 \)と書き換えると
$$ = \frac{\alpha^r}{x!\Gamma(r)} \frac{\Gamma(x+r)}{(\alpha+1)^{x+r}} \int^\infty_0 \frac{\beta^q \lambda^{q-1} \exp(-\beta\lambda)}{\Gamma(q)} d\lambda$$ すると、積分しているのは形状\(q\), 尺度\(1/\beta\)のガンマ分布だってことになるじゃないですか。確率分布だから積分すれば1じゃないですか。なので丸ごと消えるわけ。悪辣だよなあ。あいつらみんな東大とか行ったんだろうなあ。俺は心が清らかなので貧乏人向け二流大学に行ったけどな。
 残った部分を、ガンマ関数ならびに階乗のパートと、それ以外のパートにわける。
$$ = \frac{\Gamma(x+r)}{x!\Gamma(r)} \times \alpha^r \frac{1}{(\alpha+1)^x} \frac{1}{(\alpha+1)^r} = \frac{\Gamma(x+r)}{x!\Gamma(r)} \left( \frac{\alpha}{\alpha+1} \right)^r \left(\frac{1}{\alpha+1}\right)^x$$ ときに、ガンマ関数と何か。それは自然数の階乗 \( a! = a (a-1)(a-2) \cdots \) を実数に拡張したもので、\(\Gamma(a) = a \Gamma(a-1) = a(a-1) \Gamma(a-2) = \cdots \)が成り立つような謎の関数だ。自然数\(x\)については\(x!\ = \Gamma(x+1)\)と書き換えることができる(1ずれるところがいやらしいけれど)。
 さて、\(n\)個から\(k\)個を選ぶ組み合わせの数は\( C(n,k) = \frac{n!}{k!(n-k)!}\)だが、この\(n, k\)を実数に拡張し、ガンマ関数で\( C(n,k) = \frac{\Gamma( n + 1 )}{\Gamma(k+1)\Gamma(n-k+1)} \)と書くこともできる。なんやしらんけど、これはまあそういうものだと受け入れよう。ここに\(n = x + r – 1, k=x\)を代入すると \( C(x + r – 1,x) = \frac{\Gamma(x+r)}{\Gamma(x+1)\Gamma(r)} \)となる。よって上の式は $$ P(X = x | r, \alpha) = C(x + r – 1,x) \left( \frac{\alpha}{\alpha+1} \right)^r \left(\frac{1}{\alpha+1}\right)^x$$ と書き換えることができるわけだ。

 さて、話はいきなり飛ぶけれど…
 確率\(p\) で成功するベルヌーイ試行を繰り返しおこなうとき、\(m\)回成功するまでに何回試行を繰り返す羽目になるか。その回数を\(X_1\)としよう。\(n\)回目にようやく到達する確率は、その前までの\(n-1\)回のうち\(m-1\)回において成功し(その確率は\(C(n-1, m-1) p^{m-1} (1-p)^{n-m}\))、かつ今回成功する確率だから $$ P(X_1 = n|m,p) = C(n-1, m-1) p^m (1-p)^{n-m} $$となる。この式で表される確率分布を負の二項分布と呼ぶ。
 これはこういう風に書くこともできる。\(m\)回成功するまでの失敗試行の数を\(X_2\)とする。それが\(n\)となる確率は、その前までの\(n+m-1\)回のうち\(n\)回において失敗し(その確率は \(C(n+m-1, n) p^{m-1} (1-p)^n\))、かつ今回成功する確率だから $$ P(X_2 = n|m,p) = C(n+m-1, n) p^m (1-p)^n $$ これを負の二項分布と呼ぶこともある。

 負の二項分布の二番目の定式化のほうに、\( n=x, m=r, p=\frac{\alpha}{\alpha+1} \)を代入すると、$$ P(X_2 = x|r,\alpha) = C(x+r-1, x) \left( \frac{\alpha}{\alpha+1} \right)^r \left( \frac{1}{\alpha+1} \right)^x $$ なんと、これは懸案の\( P(X = x | r, \alpha) \) と同じ式ではないか。

 このように、「人がある出来事を起こす単位期間あたり平均回数が形状パラメータ \(r\), 尺度パラメータ \( \frac{1}{\alpha} \) のガンマ分布に従うとき、ある人がその出来事を単位期間中に\(x\)回起こす確率」は、負の二項分布に従う。\(r\)が自然数であれば、それは「確率\( \frac{\alpha}{\alpha+1}\)で成功するベルヌーイ試行を繰り返すとき、\(r\)回成功するまでの失敗回数が\(x\)である確率」に等しい。
 … こうしてみると、理路は整然としているものの、結論だけみると、なんだか不思議な話である。