読了:「仁義なきヤクザ映画史」「鬼の筆」「トルコ 建国100年の自画像」「赤ちゃんポストの真実」「空からきた魚」

ノンフィクション、その2。

稀代の迷作「幻の湖」製作への経緯について関心があって読んだんだけど、失敗に至る要因が積み重なっていくくだり、胃が痛くなるような思いであった。辛いなあ。
続きを読む

読了:「イーロン・マスク」「戦時下のウクライナを歩く」「ナチズムの美学」「台湾のアイデンティティ」「かたちには理由がある」「『伝える』ことと『伝わる』こと」「検証 ナチスは『良いこと』もしたのか?」

2023年末までに読んだ本のうち、ノンフィクション、その1。


続きを読む

読了:「花の雨が降る」「詩歌川百景」「これ描いて死ね」「あらあらかしこ」「東京ヒゴロ」「おいおいピータン」

2023年末までに読んだコミックス、その3。

上記リンクは電子書籍だが、冊子体で読んだ。2022年に自費出版で発表された傑作「ROCA」の新作エピソード集。
続きを読む

読了:「ロシア・ノート」「オール・ザ・マーブルズ!」「海が走るエンドロール」「ひらやすみ」「アルテ」「3月のライオン」「だんドーン」

2023年末までに読んだコミックス、その2。

作者はイタリアの漫画家。暗殺されたロシアのジャーナリスト、アンナ・ポリトコフスカヤを描く。
続きを読む

読了:「きのう何食べた?」「みっしょん!!」「ダンジョン飯」「BLACK LAGOON」「贋 まがいもの」「はなうたレコード」「百姓貴族」

2023年中に読んだ本を記録しておく。まずはコミックスから。

私が尊敬してやまない名匠、入江喜和先生の新作は、平凡な54歳主婦の葛藤を描く。主人公の年代が徐々に上昇している…
続きを読む

読了: Godambe & Thompson (1986) 推定関数の理論から見た母集団特性の推定 (難しい話をより難しく)

Godambe, V.P, & Thompson, M.E. (1986) Parameters of Superpopulation and Survey Population: Their Relationships and Estimation. International Statistical Review, 53(2), 127-138.

 調査データの分析について調べていると、母平均のHajek推定量 (標本の個々の値をその個体の標本包含確率の逆数で重みづけて平均した量)は母平均のデザイン不偏推定量ではないけれど、実はある種のモデルのもとでモデル不偏推定量なのだ… という話がでてきて、そこでこの論文がよく引用されている。
 第一著者のGodambeさんという人は推定方程式アプローチの理論で有名な人らしい。第二著者はHorvitz-Thompson推定量のThompsonとは別人の模様。
続きを読む

読了: 柳本(1995) 推定方程式に基づく推定

 読んだものはなんでも記録しておこう、ということで…

柳本武美(1995) 推定方程式に基づく推定: 最尤法とモーメント法から. 応用統計学, 24(1), 1-12.

 別の論文に挑戦しようとして(メモしておくとGodambe & Thompson(1986)、有限母集団特性のモデルベース推定の話)、到底歯が立たず、せめてもの手がかりにならないかと思ってめくった。
 正直、これも難しくてよくわからんかった… 悲しい…
続きを読む

読了: Dorfman & Valliant (1997) Hajek推定量再訪

Dorfman, A.H., Valliant, R. (1997) The Hajek Estimator Revisited. Proceedings of the Section on Survey Methods Research, American Statistical Association.

 標本ウェイティングについて調べ物をしていると、googleの検索結果にはいつもこれが上位に挙がってくる。内容は難しそうだし、そもそも論文ではないし、毎回「これはちがうだろう」と避けていたのだが、あまりによく見かけるので、これもなにかの勉強だろうと思い、メモをとりながら読んでみた。正直、かなり早い段階で後悔しはじめたのだが…
続きを読む

読了: Delovoye & Savje (2020) Horvitz-Thompson推定量の一致性

 標本抽出について調べていると、値を抽出確率の逆数で重みづけて合計して母集団サイズで割ると(Horvitz-Thompson推定量)、それは母平均の不偏推定値だよ、いっぽう母集団サイズじゃなくて重みの和で割ると(Hajek統計量)、それは不偏じゃない、でも一致推定量だよ、なんていう話が出てくる。で、不偏性の証明は出てくるけど、一致性の証明は出てこない。おまえらユーザには理解できんだろうから省略するよ、というニュアンスがひしひしと伝わってくる。なんだかイライラする。いま文化大革命とか起きたら、私は紅衛兵となってキャンパスに突入し統計家を群衆のもとに引き出して自己批判を迫るかもしれない。(すいません冗談です)
 まあご配慮は正しいんだけどさ。推定量の漸近的挙動なんて途方に暮れるじゃないですか。聞かされても絶対理解できるわけないじゃないですか。でもちょっと覗き見したいんですよね。背伸びして大人の世界に触れてみたい、というか。(いいおっさんが… 我ながらキモイ)

Delovoye, A., Savje, F. (2020) Consistency of the Horvitz-Thompson estimator under general sampling and experimental design. Journal of Statistical Planning and Inference, 207, 190-197.

 そんなこんなで、本文が短いので読んでみた。HT推定量の一致性の一般的条件を示すのだそうです。Google様いわく、被引用件数11件。
 さあ、怖いものみたさでゴー!
続きを読む

読了: Tille & Wilhelm (2017) 標本抽出デザインの良し悪しを決める三つの原理

Tille, Y., Wilhelm, M. (2017) Probability Sampling Designs: Princeples for Choice of Design and Balancing. Statistical Science, 32(2), 176-189

 Statistical Science誌の2017年の調査特集号に掲載された論文を全部読んじゃおうプロジェクト、その第4弾。この論文は標本抽出デザインの選択という話で、いまの私の関心からちょっと外れているので、メモは粗めである。
続きを読む

読了: Skinner & Wakefield (2017) 標本抽出デザインと調査データ分析:イントロダクション

 仕事の都合で、調査データのウェイティングという複雑怪奇な問題について考える羽目になることがあるのだけれど、なにか役にたつ資料はないものかと探していると、Statistical Scienceの2017年の調査特集号に突き当たることが多い。去年目を通した Elliot & Valliant(2017)、先日読んだBreidt & Opsomer(2017)もこの号に掲載された論文だった。
 四の五の言わず、この号に載った9本の論文(残り7本)に片っ端から目を通しちゃえばいいのではないか、と思って、とりあえず(おそらくは編者によるのであろう)イントロをパラパラめくり始めたら、これが意外に面白く、かつ難しく… 結局、最初からメモを取りながら読み直すことになった。

Skinner, C., Wakefield, J. (2017) Introduction to the Design and Analysis of Complex Survey Data. Statistical Science, 32(2), 165-175.
続きを読む

読了:川田(2008) 許鞍華の映画について

川田耕 (2008) 憤怒・和解・自由 -許鞍華の映画について- (上), 京都学園大学経済学部論集, 17(2), 47-60.
川田耕 (2008) 憤怒・和解・自由 -許鞍華の映画について- (下), 京都学園大学経済学部論集, 18(1), 53-67.

 香港の映画監督アン・ホイの作品についての評論。作品でいうと、デビュー前のTVシリーズから「おばさんのポストモダン生活」あたりまでをカバーしている。未見の作品のあらすじを知りたくて手に取った。
 「男人四十」というマイナー作品に対する評価が非常に高くてちょっとびっくりした。あれ、ジャッキー・チュンがカリーナ・ラムと寝ちゃうのってどうなの? 悩んでおいて結局寝るの? って思うんですけどね。もっとも、私がモテるおっさんに冷たすぎるというだけで、物語としてはあれでいいのかもしれない。
続きを読む

ウェイティング回顧録 2023

 世の中には、興味を持って取り組める事柄もあれば、全く興味はないけどやらなきゃならない雪かきみたいな仕事もあれば、本質的な興味はないんだけけど行きがかり上なんだか気になる問題というのもある。私にとっての三番目の代表例が、調査における標本ウェイティングである。きわめて切実な問題であり(その割に解説が少ない)、とても難しい(その割にお金にならない)。

 というわけで、ときどき必要に駆られて資料を読み、ブログに記録したりしているんだけど、ブログに書いた内容を忘れるどころか、書いたことさえ忘れてしまう。三歩歩けば全て忘れる、ニワトリなみの記憶力である。
 そこで、これまでに書いたウェイティングに関するエントリをまとめておこう。… というエントリを、実は2015年に書いているんだけど、それから幾星霜、追加して読んだものもたまってきて、いよいよ記憶があやふやになってきた。再度まとめ直す。すいません、これは私の私による私のためのメモです。
続きを読む

読了: Breidt & Opsomer (2017) 調査データ分析の第三の道、モデル・アシステッド・アプローチ (後編)

前々回前回に引き続き、

Breidt, F.J., Opsomer, J.D. (2017) Model-assisted survey estimation with modern prediction techniques. Statistical Science, 32(2), 190-205.

のメモ、最終回。いよいよ面白い話になってくる。GREG推定でいうところの「作業モデル」を機械学習で組んじゃうのだ。
続きを読む

読了: Breidt & Opsomer (2017) 調査データ分析の第三の道、モデル・アシステッド・アプローチ (中編)

前回に引き続き、

Breidt, F.J., Opsomer, J.D. (2017) Model-assisted survey estimation with modern prediction techniques. Statistical Science, 32(2), 190-205.

のメモ、その第二回。いよいよ、著者の云うところのモデル・アシステッド推定とはなんなのかが明らかになる。話の先取りになるけど、要するにGREG推定量のことなのだ。ナアンダというなかれ、俺はこういう風に考えたことなかったよ。
続きを読む

読了: Breidt & Opsomer (2017) 調査データ分析の第三の道、モデル・アシステッド・アプローチ (前編)

Breidt, F.J., Opsomer, J.D. (2017) Model-assisted survey estimation with modern prediction techniques. Statistical Science, 32(2), 190-205.

 標本ウェイトつき調査データの分析方法について調べていて(ときどき仕事の都合でそういうニーズに突き動かされる)、たまたまめくった奴なんだけど、意外や意外、とても面白くて、最後まで目を通すことなく、途中で冒頭に戻ってメモを取り始めた。しかも講演口調で。
 実はいまもって読み終えてないんだけど(記事題名に読了とあるのは現時点で偽りである)、これ、もっと早く読んでおけばよかった… そうすれば先日のToth & Eltinge (2011)ももう少しは理解できていたかもしれない。

 長くなりそうなので数回に分ける。まずは全9章のうち1-3章のメモ。
続きを読む

読了: Toth & Eltinge (2011) ウェイトつきの調査データでつくった回帰木が一致性を持つ条件

Toth, D., Eltinge, J. (2011) Building consistent regression trees from complex sample data. Journal of the American Statistical Association, 106(409), 1626-1636.

 仕事の都合で標本ウェイトつきのデータを使って分類木モデルをつくりたくなり、あれこれ調べていて見つけた論文。
 少なくともタイトルは知りたいことにぴったりだし、第一著者はサーベイデータに特化した分割木・森モデリングのRパッケージrpmsの中の人だし、これを読めば道が開けるかな、と思ったのが運の尽き… いやあ、えらい目にあった。
続きを読む