読了: Lucas (1985) カウント時系列のCUSUM法による監視

Lucas, J. (1985) Count Data CUSUM’s. Technometrics, 27(2), 129-144.

 時系列監視手法のうち、件数データに対するCUSUM法の解説。難しい話はなし、実務家向けな啓蒙論文である。
 なぜ私が生まれる前の論文を読まなければならないのかと思うが(すいません嘘です、超生まれてましたね、ヒゲ剃ったりしてましたね)、温故知新っていうことで…

1. イントロダクション
 [品質管理でのCUSUM法について紹介して…]
 本論文では件数データのCUSUM法について述べる。2つのモデルを考える。間隔当たりの件数をモデル化するポアソンCUSUMと、イベント間間隔CUSUMである。
 CUSUM管理スキームというのはWald系列確率比検定(SPRT)の系列だと考えることができる。ここから最適性についての検討がはじまって…[以下、先行研究レビュー。品質管理についての十分な知識があったら面白い内容なんだろうけど…残念。後略]

2. 実装例
 要するにCUSUMといのは、観察\(Y_i\)と参照値\(k\)との差を累積していき、それが決定間隔\(k\)を超えたらout-of-control警告を出すのである。
 ポアソンCUSUMの場合でいうと統計量は$$ S_i = \mathrm{max} (0, Y_k-k + S_{i-1}) $$ となる。標準的には\(S_0 = 0\)でだが、FIR特性を付け加える場合は正の値とする。おすすめは\(h/2\)で、これは初回のSPRTで\(\alpha\)と\(\beta\)を等しくしていることになる。[FIRとはfast initial responseの略。このあとの数値例をみると、FIR特性を付け加えても頭の数期しか効かないので、まあ手法じゃなくて運用上の工夫でどうにでもなるかっていう感じだけど、品質管理の分野ではそうもいってられないのだろう]
 ロバストCUSUMという提案もある。外れ値限界を決め、2個外れたら警告する。
 CUSUM管理スキーマの評価にはふつうARLを使う。in-controlのARLは幾何分布で近似することが多い。[…]
 [数値例…]

3. 件数データのCUSUMの設計
 まず\(k\)を決める。
 受容できるプロセスでの件数平均を\(\mu_a\), 素早くみつけたいレベルの件数平均を\(\mu_d\)とする。実務的には、\(\mu_a\)は直近の平均にすることが多い。
 ポアソンCUSUMなら、$$ k_p = \frac{\mu_d – \mu_a}{\log \mu_d – \log \mu_a} $$ とする。これはSPRTで\(H_0: \mu = \mu_a, H_1:\mu = \mu_d\)としたのと同じになる。\(k_p \geq 1\)なら整数に丸めちゃってよい。なぜかというと、あとで出てくる表を使いたいから。
 イベント間間隔CUSUMなら…[メモ省略]

 次に\(h\)を決める。これはですね、表があるんです。\(k\)と\(h\)からARLを引く表が。[見方がよくわからない… たぶん表側が\(h, k\)で、表頭が\(\mu_d / k\)で、値が\(ARL^0\)だと思うんだけど…]
 [数値例。ちゃんと読んでない]

4. 両側CUSUM
[めんどくさいのでメモしなかったが、ここまでの話はすべて片側だけに警告限界を置く話であった。というか、統計量そのものが片側なのである。うん、まあ、実務的ニーズはふつう片側だろうね。この章では両側にしたときにARLがどうなるかというような話が書いてある]

5. ロバスト・ポアソンCUSUM
[パス]

6. 数値例
[パス]

7. 結論
[略]
———————
 古めの論文を読むとき、書き方がいまと違っててイライラする場合と、牧歌的でよろしおすな… とほっこりする場合があるんだけど、今回は後者であった。なんというか、いまでいう技術ブログみたいな感じですよね。そういう主旨のページだったのかもしれないけれど。