« 2017年11月 | メイン | 2018年1月 »
2017年12月16日 (土)
今年の秋は仕事の都合で小地域推定について勉強する羽目になり、これはかなり辛い経験であった。嗚呼人生間違えた、もう残りは早送りにしたい、と思う頻度が、普段だと一日一回くらいなんだけど、この数ヶ月間は敬虔なイスラム教徒のお祈りよりも多いという感じであった。すごい。落ち込む度に腕立て伏せしてたらいまごろムキムキだったのに。
Pfeffermann, D. (2013) New Important Development in Small Area Estimation. Statistical Science, 28(1), 40-68.
というわけで、個人的な小地域推定ブームの終わり頃に読みかけた長い長いレビュー論文なんだけど、メモを取る余裕もなく、そのうちに用事が終わって関心が失せてしまい、途中で放り出してしまった。
とはいえ、今回痛感したのは、ああ小地域推定の勉強はしておくべきだ... ということであった。マーケティングのための消費者調査においては、それはそれは大変に身近な話題である(たとえば、認知率が低いブランドのイメージ測定、接触率の低いプロモーションの接触者による評価、いずれも立派な小地域推定問題だ)。なぜこれまでちゃんと勉強していなかったのかね、と臍を噛む思いであった。
いずれきちんと読む機会もありそうだから、読み終えてないけど読了扱いにして、見出しだけ記録しておく。
1. はじめに
いわく。2002年に小地域推定のレビューを書いたんだけど、実はそのときは「もう話題として枯れてきたな」と思っていた。9年後のいま振り返るに、私は間違っていた、この研究分野の進展はすごい。この論文ではRao(2003)の本以降の研究についてレビューする。
2. 背景
小地域推定(SEA)とはなにか。モデルベースとデザインベースのちがい。
3. 記法
4. デザインベース手法
4.1 よく使われているデザインベース手法
直接推定量、synthetic推定量、combined推定量。
4.2 デザインベースSAEの最近の進展
calibrated推定量、道具変数を用いた推定量、... [読んでないので見出しも作れない]
4.3 デザインベースSAEのいい点と悪い点
5. モデルベース手法
5.1 一般的定式化
5.2 よく使われているモデル
エリアレベルモデル、nested errorユニットレベルモデル、混合ロジスティックモデル(対象となる反応が二値のとき)、の3つにわけて紹介。あーあ、もっと早く読んでおけばよかった。
えーと、エリアレベルモデルの注意点として、推定したい小地域パラメータではなくそれを変換した奴についてモデリングしている場合、モデル自体はEBLUPでも実はEBLUPになっていない、という話が紹介されていた。たとえば$log(\theta)$のEBLUPは$\theta$のEBLUPじゃないでしょ、という話。そうなんだよね... 気がついてはいたんだけど、自分のなかでごまかしていた... その点でFay-HerriotモデルのEBLUPよりもEB(経験ベイズ)やHB(階層ベイズ)のほうが優れているのだそうだ。
ここから全く読んでないけど、
6. モデルベースSAEの進展。
6.1 予測MSEの推定。
6.2 予測区間の計算。
6.3 ベンチマーキング。モデルの誤指定が怖いので、デザインベースと比べる、というような話らしい。
6.4 共変量の予測変数の説明。
6.5 外れ値の対処。
6.6 さらなるrobustificationのためのさまざまなモデルと推定手法。分位点推定とか、罰則つきスプライン回帰を使うとか、ベイズ推定で経験尤度を使うとか、そういう話らしい。そんな話題があるのか...
6.7 順位付きの小地域変換の予測。あらかじめ順番が分かってるというような話かなあ? ちゃんと読まんとわからんな。
6.8 新しい具体的応用。識字率の評価、poverty mapping。
7. 情報的標本抽出・欠損のもとでのSAE。切実な話だけど、いかにも難しそう...
8. モデル選択とチェック。約4pにわたって延々書いてある。ぶひー。
9. 結語。えーと、このレビューは頻度主義の肩をかなり強力に持っているけど、ベイジアンのほうが柔軟な面もある(上でメモした、なにかのリンク関数がはいっているエリアレベルモデルとか)。事前分布の指定は大変だけど、チェックする方法はたくさんある。ベイジアンだと計算が難しい(計算量的にもスキル的にも)という指摘もあるが、それをゆうたらGLMMかて難しいでっせ。にもかかわらずいまだ頻度主義が主流なのは、要するに、公的機関がベイジアンな手法を使うのに躊躇っているからであろう。
云々。
論文:データ解析(2015-) - 読了:Pfeffermann (2013) 小地域推定レビュー in 2013
2017年12月10日 (日)
アテネのタイモン (白水Uブックス (32))
[a]
ウィリアム・シェイクスピア / 白水社 / 1983-10-01
樹脂 (ハヤカワ・ポケット・ミステリ)
[a]
エーネ リール,Ane Riel / 早川書房 / 2017-09-07
禁忌
[a]
フェルディナント・フォン・シーラッハ / 東京創元社 / 2015-01-10
フィクション - 読了:「禁忌」「樹脂」「アテネのタイモン」
自由主義は戦争を止められるのか: 芦田均・清沢洌・石橋湛山 (歴史文化ライブラリー)
[a]
美和, 上田 / 吉川弘文館 / 2016-05-20
読んだ後にメモをとっておけば良かった... とても面白い本であった。
暗い時代の人々
[a]
森 まゆみ / 亜紀書房 / 2017-04-14
大正・昭和期に生きた人々の評伝集。取り上げられているのは、斉藤隆夫、山川菊栄、山本宣治、竹久夢二、九津見房子(ゾルゲ事件に連座した社会主義者),斉藤雷太郎・立野正一(全く知らなかった。京都で反ファッショの新聞を発行した人)、古在由重、西村伊作(文化学院の創立者)。
日本近現代史 - 読了:「自由主義は戦争を止められるか」「暗い時代の人々」
トラクターの世界史 - 人類の歴史を変えた「鉄の馬」たち (中公新書)
[a]
藤原 辰史 / 中央公論新社 / 2017-09-20
題名の通り、トラクターの歴史についての本。これは評判になるだろうなあと思いながら目を通した。案の定、売れている模様。
ハプスブルク帝国 (講談社現代新書)
[a]
岩崎 周一 / 講談社 / 2017-08-17
ノンフィクション(2011-) - 読了:「トラクターの世界史」「ハプスブルグ帝国」
権力の空間/空間の権力 個人と国家の〈あいだ〉を設計せよ (講談社選書メチエ)
[a]
山本 理顕 / 講談社 / 2015-04-11
なんとなく手に取ったのだが、これは難解ながらも面白い本であった。建築家による、私はアーレントをこう読んだ、という本。
分解するイギリス: 民主主義モデルの漂流 (ちくま新書 1262)
[a]
近藤 康史 / 筑摩書房 / 2017-06-06
ナチスの「手口」と緊急事態条項 (集英社新書)
[a]
長谷部 恭男,石田 勇治 / 集英社 / 2017-08-19
文化大革命:〈造反有理〉の現代的地平
[a]
/ 白水社 / 2017-08-23
テーリー・ガーター 尼僧たちのいのちの讃歌 (角川選書)
[a]
植木 雅俊 / KADOKAWA / 2017-07-28
ブラック・フラッグス(下):「イスラム国」台頭の軌跡
[a]
ジョビー・ウォリック / 白水社 / 2017-07-26
ブラック・フラッグス(上):「イスラム国」台頭の軌跡
[a]
ジョビー・ウォリック / 白水社 / 2017-07-26
ノンフィクション(2011-) - 読了:「権力の空間/空間の権力」「ブラック・フラッグス」「テーリー・ガーター」「文化大革命 <造反有理>の現代的地平」「ナチスの『手口』と緊急事態条項」「分解するイギリス-民主主義モデルの漂流」
路地の子
[a]
上原 善広 / 新潮社 / 2017-06-16
歌うカタツムリ――進化とらせんの物語 (岩波科学ライブラリー)
[a]
千葉 聡 / 岩波書店 / 2017-06-14
習近平の中国――百年の夢と現実 (岩波新書)
[a]
林 望 / 岩波書店 / 2017-05-20
観応の擾乱 - 室町幕府を二つに裂いた足利尊氏・直義兄弟の戦い (中公新書)
[a]
亀田 俊和 / 中央公論新社 / 2017-07-19
人間の居場所 (集英社新書)
[a]
田原 牧 / 集英社 / 2017-07-14
バルカン―「ヨーロッパの火薬庫」の歴史 (中公新書)
[a]
マーク・マゾワー / 中央公論新社 / 2017-06-20
人口減少時代の土地問題 - 「所有者不明化」と相続、空き家、制度のゆくえ (中公新書)
[a]
吉原 祥子 / 中央公論新社 / 2017-07-19
ノンフィクション(2011-) - 読了:「人口減少時代の土地問題」「バルカン」「人間の居場所」「路地の子」「歌うカタツムリ」「習近平の中国」「観応の擾乱」
杜甫のユーモア ずっこけ孔子
[a]
興膳 宏 / 岩波書店 / 2014-03-27
中国古典文学の研究者による軽いエッセイ集。
新しい中世 相互依存の世界システム (講談社学術文庫)
[a]
田中 明彦 / 講談社 / 2017-08-10
カラスの教科書 (講談社文庫)
[a]
松原 始 / 講談社 / 2016-03-15
新装版 キン・フー武俠電影作法
[a]
キン・フー,宏一, 山田,幸洋, 宇田川 / 草思社 / 2017-05-26
ユニコード戦記 ─文字符号の国際標準化バトル
[a]
小林龍生 / 東京電機大学出版局 / 2011-06-10
高倉健 七つの顔を隠し続けた男
[a]
森 功 / 講談社 / 2017-08-30
アルカイダから古文書を守った図書館員
[a]
ジョシュア・ハマー / 紀伊國屋書店 / 2017-06-15
ノンフィクション(2011-) - 読了:「アルカイダから古文書を守った図書館員」「高倉健 七つの顔を隠し続けた男」「ユニコード戦記」「杜甫のユーモア ずっこけ孔子」「新しい中世」「カラスの教科書」「キン・フー 武侠映画作法」
パン屋再襲撃 (HARUKI MURAKAMI 9 STORIES)
[a]
/ スイッチパブリッシング / 2017-06-20
おひとり様物語(7) (ワイドKC)
[a]
谷川 史子 / 講談社 / 2017-08-09
ステキな奥さん あはっ 2
[a]
伊藤理佐 / 朝日新聞出版 / 2017-07-20
サルまん 2.0~サルでも描けるまんが教室 2.0~ (小学館クリエイティブ単行本)
[a]
相原 コージ,竹熊 健太郎 / 小学館 / 2017-06-27
みずほ草紙 4 (ビッグコミックススペシャル)
[a]
花輪 和一 / 小学館 / 2017-05-30
深夜食堂 (18) (ビッグコミックススペシャル)
[a]
安倍 夜郎 / 小学館 / 2017-05-30
ドロヘドロ(22) (IKKI COMIX)
[a]
林田球 / 小学館 / 2016-09-30
ねむようこと雑な草たち (ホーム社書籍扱コミックス)
[a]
ねむ ようこ / ホーム社 / 2017-05-25
毎日かあさん14 卒母編
[a]
西原 理恵子 / 毎日新聞出版 / 2017-09-21
インド夫婦茶碗 (23) (本当にあった笑える話)
[a]
流水りんこ / ぶんか社 / 2017-05-08
コミックス(2015-) - 読了:「インド夫婦茶碗」「毎日かあさん」「ねむようこと雑な草たち」「パン屋再襲撃」「おひとり様物語」「ステキな奥さん あはっ」「サルまん2.0」「みずほ草紙」「深夜食堂」「ドロヘドロ」
マロニエ王国の七人の騎士 1-4巻 新品セット
[a]
岩本 ナオ / 小学館 /
百姓貴族(5) (ウィングス・コミックス・デラックス)
[a]
荒川 弘 / 新書館 / 2017-11-25
鴻池剛と猫のぽんた ニャアアアン!
[a]
鴻池 剛 / KADOKAWA/エンターブレイン / 2015-10-31
百鬼夜行抄 26 (Nemuki+コミックス)
[a]
今 市子 / 朝日新聞出版 / 2017-08-21
ボンクラボンボンハウス(1)【期間限定 無料お試し版】 (FEEL COMICS)
[a]
ねむようこ / 祥伝社 / 2020-04-08
ヒャッケンマワリ (楽園コミックス)
[a]
竹田昼 / 白泉社 / 2017-08-31
みたび! 女のはしょり道
[a]
伊藤 理佐 / 講談社 / 2017-11-10
コミックス(2015-) - 読了:「女のはしょり道」「マロニエ王国の七人の騎士」「百姓貴族」「鴻池剛と猫のぽんた」「百鬼夜行抄」「ボンクラボンボンハウス」「ヒャッケンマワリ」
銃座のウルナ 4 (ビームコミックス)
[a]
伊図透 / KADOKAWA / 2017-10-12
架空の国の戦場と銃後を描く作品。いやあ、これはすごいなあ。
腕~駿河城御前試合~ 4 (SPコミックス)
[a]
南條 範夫 / リイド社 / 2012-11-27
ガイコツ書店員 本田さん (3) (ジーンピクシブシリーズ)
[a]
本田 / KADOKAWA / 2017-09-27
谷川史子 告白物語おおむね全部 30th anniversary (マーガレットコミックス)
[a]
谷川 史子 / 集英社 / 2017-05-25
銀の匙 Silver Spoon 14 (少年サンデーコミックス)
[a]
荒川 弘 / 小学館 / 2017-08-18
こいいじ(6) (KC KISS)
[a]
志村 貴子 / 講談社 / 2017-05-12
こいいじ(5) (KC KISS)
[a]
志村 貴子 / 講談社 / 2016-12-13
はじめてのひと 2 (マーガレットコミックス)
[a]
谷川 史子 / 集英社 / 2017-05-25
いやいやいや!なんぼステキな人ゆうてもそれ要するに不倫やないの!アホちゃうの、やめときやめとき!と呟きながら読んでます。お節介なおばちゃんになった気分。
コミックス(2015-) - 読了:「こいいじ」「銀の匙」「谷川史子告白物語おおむね全部」「銃座のウルナ」「駿河城御前試合 腕」「はじめてのひと」「ガイコツ書店員本田さん」
ふしぎの国のバード 4巻 (ハルタコミックス)
[a]
佐々 大河 / KADOKAWA / 2017-11-15
ダンジョン飯 5巻 (ハルタコミックス)
[a]
九井 諒子 / KADOKAWA / 2017-08-10
おもたせしました。 2 (BUNCH COMICS)
[a]
うめ(小沢高広・妹尾朝子) / 新潮社 / 2017-10-07
少女終末旅行 5 (BUNCH COMICS)
[a]
つくみず / 新潮社 / 2017-09-08
めしばな刑事タチバナ 26 (トクマコミックス)
[a]
坂戸佐兵衛,旅井とり / 徳間書店 / 2017-07-31
めしばな刑事タチバナ 27 (トクマコミックス)
[a]
坂戸佐兵衛,旅井とり / 徳間書店 / 2017-10-31
ワカコ酒 9 (ゼノンコミックス)
[a]
新久千映 / 徳間書店 / 2017-08-19
コミックス(2015-) - 読了:「おもたせしました」「少女終末旅行」「ワカコ酒」「めしばな刑事タチバナ」「ダンジョン飯」「ふしぎの国のバード」
プリニウス6 (バンチコミックス45プレミアム)
[a]
ヤマザキマリ,とり・みき / 新潮社 / 2017-10-07
悪魔を憐れむ歌 1 (バンチコミックス)
[a]
梶本レイカ / 新潮社 / 2017-05-09
重版未定
[a]
川崎昌平 / 河出書房新社 / 2016-11-26
大江戸国芳よしづくし (ニチブンコミックス)
[a]
崗田屋 愉一 / 日本文芸社 / 2017-03-29
弟の夫(4) (アクションコミックス(月刊アクション))
[a]
田亀 源五郎 / 双葉社 / 2017-07-12
ねぇ、ママ (A.L.C.DX)
[a]
池辺葵 / 秋田書店 / 2017-06-16
アイとアオの境界 (1) (バーズコミックス)
[a]
天堂 きりん / 幻冬舎コミックス / 2016-08-24
心に傷を抱えた地味な書店員と無口な従兄弟の話。この著者の作品は前にも読んだことがあるはずだが、正直全く記憶に残っていない。こんなに魅力的なマンガを描く人だったのね、とびっくり。続きが楽しみだが、ちょっと心配でもある。どうか打ち切りになりませんように...
コミックス(2015-) - 読了:「プリニウス」「ねぇ、ママ」「アイとアオの境界」「弟の夫」「大江戸国芳よしづくし」「重版未定」「悪魔を憐れむ歌」
銀のニーナ(4) (アクションコミックス)
[a]
イトカツ / 双葉社 / 2014-03-28
レイリ(4)(少年チャンピオン・コミックス・エクストラ)
[a]
岩明 均,室井 大資 / 秋田書店 / 2017-10-20
リバースエッジ 大川端探偵社(9) (ニチブンコミックス)
[a]
ひじかた 憂峰 / 日本文芸社 / 2017-11-29
漫画家接待ごはん (1) (角川コミックス・エース)
[a]
瀬口 たかひろ / KADOKAWA / 2017-06-26
淡島百景 2
[a]
志村貴子 / 太田出版 / 2017-07-25
さよなら、おとこのこ(1) (ビーボーイコミックスデラックス)
[a]
志村 貴子 / リブレ / 2017-09-08
タイムスリップオタガール(1) (ポラリスCOMICS)
[a]
佐々木 陽子 / ほるぷ出版 / 2017-01-12
タイムスリップオタガール(2) (ポラリスCOMICS)
[a]
佐々木 陽子 / ほるぷ出版 / 2017-08-08
内容とは関係ない話だけど、このマンガが連載されているのはCOMIC ポラリスというWebコミックメディア。運営元はフレックスコミックス、聞くところによればBookliveの完全子会社、つまりは凸版印刷傘下である。
でもこの単行本の印刷は大日本印刷なのね、へー... と思いながら奥付を眺めていて、発売元に気がついてびっくり。ほるぷ出版が発売元になっている。あの労働争議で知られるほるぷ出版!?いまは日販傘下じゃなかったの?と。
これは私の世間知らずで、Wikipediaによれば、日販はとっくにほるぷ出版を手放しており、その後いろいろあって、アプリックスというソフトウェア開発の会社に買われた。この会社はフレックスコミックスの親会社でもあった、ということらしい。もっとも今年になってアプリックス社は両方を売却し、フレックスコミックスはBookliveに、ほるぷ出版は静山社(あのハリ・ポタの)の兄弟会社という位置づけになっているのだそうだ。
コミックス(2015-) - 読了:「さよなら、おとこのこ」「淡島百景」「銀のニーナ」「漫画家接待ごはん」「リバーズ・エッジ大川端探偵社」「レイリ」「タイムスリップ・オタガール」
ど根性ガエルの娘 1 (ヤングアニマルコミックス)
[a]
大月悠祐子 / 白泉社 / 2017-02-17
ど根性ガエルの娘 2 (ヤングアニマルコミックス)
[a]
大月悠祐子 / 白泉社 / 2017-02-17
ど根性ガエルの娘 3 (ヤングアニマルコミックス)
[a]
大月悠祐子 / 白泉社 / 2017-06-29
ペリリュー ─楽園のゲルニカ─ 3 (ヤングアニマルコミックス)
[a]
武田一義,平塚柾緒(太平洋戦争研究会) / 白泉社 / 2017-07-28
木根さんの1人でキネマ 4 (ヤングアニマルコミックス)
[a]
アサイ / 白泉社 / 2017-10-27
3月のライオン 12 (ヤングアニマルコミックス)
[a]
羽海野チカ / 白泉社 / 2016-09-29
3月のライオン 13 (ヤングアニマルコミックス)
[a]
羽海野チカ / 白泉社 / 2017-09-29
コミックス(2015-) - 読了:「ど根性ガエルの娘」「3月のライオン」「木根さんのひとりでキネマ」「ペリリュー」
シュトヘル (14) (BIG SPIRITS COMICS SPECIAL)
[a]
伊藤 悠 / 小学館 / 2017-05-12
西夏王朝の滅亡を題材にした面白そうなマンガだったのだが、残念ながら途中から話の筋がわからなくなってしまった。いずれ読み直してみたい。
BOX~箱の中に何かいる~(1) (モーニングコミックス)
[a]
諸星大二郎 / 講談社 / 2016-11-22
惑わない星(2) (モーニング KC)
[a]
石川 雅之 / 講談社 / 2017-03-23
イムリ 21 (ビームコミックス)
[a]
三宅 乱丈 / KADOKAWA / 2017-05-25
傘寿まり子(1) (KCデラックス)
[a]
おざわ ゆき / 講談社 / 2016-11-11
傘寿まり子(2) (KCデラックス)
[a]
おざわ ゆき / 講談社 / 2017-02-13
傘寿まり子(3) (KCデラックス)
[a]
おざわ ゆき / 講談社 / 2017-05-12
カフェでカフィを (集英社クリエイティブコミックス)
[a]
ヨコイ エミ / 集英社クリエイティブ / 2017-09-25
コミックス(2015-) - 読了:「BOX」「シュトヘル」「イムリ」「惑わない星」「傘寿まり子」「カフェでカフィを」
たそがれたかこ(10) (KCデラックス)
[a]
入江 喜和 / 講談社 / 2017-08-09
完結巻。ここ数年でももっとも面白かったマンガを選べといわれたら、この作品になると思う。お疲れ様でした。
おひとりさま出産 3 育児編 (集英社クリエイティブコミックス)
[a]
七尾 ゆず / 集英社クリエイティブ / 2016-05-25
おひとりさま出産 5 育児編 (集英社クリエイティブコミックス)
[a]
七尾 ゆず / 集英社クリエイティブ / 2017-07-25
そしてボクは外道マンになる 1 (ヤングジャンプコミックス)
[a]
平松 伸二 / 集英社 / 2017-08-18
そしてボクは外道マンになる 2 (ヤングジャンプコミックス)
[a]
平松 伸二 / 集英社 / 2017-09-19
イノサン Rougeルージュ 5 (ヤングジャンプコミックスDIGITAL)
[a]
坂本眞一 / 集英社 / 2017-03-17
イノサン Rouge ルージュ 6 (ヤングジャンプコミックス)
[a]
坂本 眞一 / 集英社 / 2017-08-18
コミックス(2015-) - 読了:「イノサンRouge」「たそがれたかこ」「おひとりさま出産」「そしてボクは外道マンになる」
中間管理録トネガワ(5) (ヤンマガKCスペシャル)
[a]
福本 伸行,三好 智樹,橋本 智広 / 講談社 / 2017-06-06
きのう何食べた?(13) (モーニング KC)
[a]
よしなが ふみ / 講談社 / 2017-09-22
小路花唄(2) (アフタヌーンKC)
[a]
麻生 みこと / 講談社 / 2017-10-06
めしにしましょう(2) (イブニングKC)
[a]
小林 銅蟲 / 講談社 / 2017-02-23
ゴールデンゴールド(3) (モーニング KC)
[a]
堀尾 省太 / 講談社 / 2017-10-23
さよならしきゅう (Kissコミックス)
[a]
岡田有希 / 講談社 / 2017-09-07
いぬやしき(9) (イブニングKC)
[a]
奥 浩哉 / 講談社 / 2017-05-23
いぬやしき(10) (イブニングKC)
[a]
奥 浩哉 / 講談社 / 2017-09-22
コミックス(2015-) - 読了:「いぬやしき」「さよならしきゅう」「ゴールデンゴールド」「めしにしましょう」「きのう何食べた?」「中間管理職トネガワ」「小路花唄」
スティーブ・ジョブズ(6)<完> (KCデラックス)
[a]
ヤマザキ マリ / 講談社 / 2017-07-13
かくしごと(4) (月刊少年マガジンコミックス)
[a]
久米田康治 / 講談社 / 2017-06-16
甘々と稲妻(9) (アフタヌーンKC)
[a]
雨隠 ギド / 講談社 / 2017-07-07
7人のシェイクスピア NON SANZ DROICT(2) (ヤンマガKCスペシャル)
[a]
ハロルド 作石 / 講談社 / 2017-07-06
7人のシェイクスピア NON SANZ DROICT(3) (ヤンマガKCスペシャル)
[a]
ハロルド 作石 / 講談社 / 2017-11-06
ランド(5) (モーニングコミックス)
[a]
山下和美 / 講談社 / 2017-09-22
聖☆おにいさん(14) (モーニング KC)
[a]
中村 光 / 講談社 / 2017-09-22
コミックス(2015-) - 読了:「聖☆おにいさん」「スティーブ・ジョブズ」「かくしごと」「甘々と稲妻」「七人のシェイクスピア」「ランド」
健康で文化的な最低限度の生活 (5) (ビッグコミックス)
[a]
柏木 ハルコ / 小学館 / 2017-05-30
海街diary 8 恋と巡礼 (フラワーコミックス)
[a]
吉田 秋生 / 小学館 / 2017-04-10
だんだん街の徳馬と嫁 (上巻) (ビッグコミックス)
[a]
藤見 よいこ / 小学館 / 2017-09-12
だんだん街の徳馬と嫁 (下巻) (ビッグコミックス)
[a]
藤見 よいこ / 小学館 / 2017-11-10
ヴィンランド・サガ(20) (アフタヌーンKC)
[a]
幸村 誠 / 講談社 / 2017-11-22
オリオリスープ(4) (モーニングコミックス)
[a]
綿貫芳子 / 講談社 / 2017-11-22
殺さざる者、生くべからず(1) (ヤンマガKCスペシャル)
[a]
中丸 洋介 / 講談社 / 2017-08-04
そういえばこれどうなったんだろうと調べてみたら、単行本三巻分で打ち切りになっちゃったらしい。あらら。
コミックス(2015-) - 読了:「殺さざる者、生くべからず」「オリオリスープ」「健康で文化的な最低限度の生活」「海街Diary」「だんだん街の徳馬と嫁」「ヴィンランド・サガ」
猫のお寺の知恩さん (4) (ビッグコミックス)
[a]
オジロ マコト / 小学館 / 2017-06-30
猫のお寺の知恩さん (5) (ビッグコミックス)
[a]
オジロ マコト / 小学館 / 2017-10-30
血の轍 (1) (ビッグコミックス)
[a]
押見 修造 / 小学館 / 2017-09-08
闇金ウシジマくん 41 (ビッグコミックス)
[a]
真鍋 昌平 / 小学館 / 2017-10-30
写真屋カフカ (ビッグコミックススペシャル)
[a]
山川 直人 / 小学館 / 2015-08-28
プリンセスメゾン (4) (ビッグコミックス)
[a]
池辺 葵 / 小学館 / 2017-06-12
ABLE (1) (サンデーGXコミックス)
[a]
伊藤 明弘 / 小学館 / 2015-01-19
コミックス(2015-) - 読了:「ABLE」「猫のお寺の知恩さん」「血の轍」「闇金ウシジマくん」「写真屋カフカ」「プリンセスメゾン」
MUJIN 無尽 4巻 (ヤングキングコミックス)
[a]
岡田屋鉄蔵 / 少年画報社 / 2017-05-30
後半は幕末の花魁・小稲太夫の話になるのだが、吉原・稲本楼の跡地は、現在ではホテル稲本というビジネスホテルになっているらしい。へー。
甘木唯子のツノと愛 (ビームコミックス)
[a]
久野 遥子 / KADOKAWA / 2017-07-24
なるほど、これは評判になるわけだ...
BLUE GIANT SUPREME(2) (ビッグコミックススペシャル)
[a]
石塚真一 / 小学館 / 2017-06-30
BLUE GIANT SUPREME(3) (ビッグコミックススペシャル)
[a]
石塚真一 / 小学館 / 2017-10-30
重版出来! (10) (ビッグコミックス)
[a]
松田 奈緒子 / 小学館 / 2017-10-12
あさひなぐ(23) (ビッグコミックス)
[a]
こざき亜衣 / 小学館 / 2017-05-31
あさひなぐ (24) (ビッグコミックス)
[a]
こざき 亜衣 / 小学館 / 2017-09-12
淋しいのはアンタだけじゃない (3) (ビッグコミックス)
[a]
吉本 浩二 / 小学館 / 2017-09-29
題名からはわかりにくいが、聴覚障害を題材にしたドキュメンタリー・マンガであった。
コミックス(2015-) - 読了:「無尽」「甘木唯子のツノと愛」「BLUE GIANT SUPREME」「淋しいのはアンタだけじゃない」「重版出来!」「あさひなぐ」
なんだかもう行き詰まっちゃったので、いったん原稿のファイルは閉じて、溜まった読了本を記録。そういえば8月から記録していなかった。
私の少年(3) (アクションコミックス(月刊アクション))
[a]
高野 ひと深 / 双葉社 / 2017-07-12
孤独な少年と孤独な30代女性との、恋ともなんとも言いがたい関係を描いた作品。このマンガは怖い。こんな都合の良い美少年はいねえよ、とは思いますが、でもやっぱり怖い。
恋は雨上がりのように (8) (ビッグコミックス)
[a]
眉月 じゅん / 小学館 / 2017-07-12
恋は雨上がりのように (9) (ビッグコミックス)
[a]
眉月 じゅん / 小学館 / 2017-11-10
アルテ 7 (ゼノンコミックス)
[a]
大久保圭 / 徳間書店 / 2017-07-20
サトコとナダ 1 (星海社COMICS)
[a]
ユペチカ / 講談社 / 2017-07-08
独身OLのすべて(6) (KCデラックス)
[a]
まずりん / 講談社 / 2017-06-23
山賊ダイアリーSS(1) (イブニングKC)
[a]
岡本 健太郎 / 講談社 / 2017-07-21
コミックス(2015-) - 読了:「恋は雨上がりのように」「私の少年」「アルテ」「サトコとナダ」「独身OLのすべて」「山賊ダイアリーSS」
2017年12月 5日 (火)
Lewis, D.D. (1998) Naive (Bayes) at forty: The independence assumption in information retrieval. ECML-98 (European Conference on Machine Learning), pp.4-15.
40年にも及ぶ長い歴史を持つ、ご存じナイーブベイズ分類器について、(パターン認識じゃなくて)情報検索の文脈でレビューしますという論文。
タイトルからして面白そうで、待ち時間中の時間潰し用に鞄にいれていた論文。読み始めてすぐに関心と違うことに気が付いたのだが(information retrievalって文字通り文書検索とかのことなのね)、フガフガと楽しく読了。
まずはおさらいから。
ベイズの定理によれば、特徴ベクトル$X=x$を持つイベント(ここでは文書)が$C$のどこかのクラス$c_k$に落ちるとして、
$P(C=c_k|X=x) = P(C=c_k) \times \frac{P(X=x|C=c_k)}{P(x)}$
簡略化して
$P(c_k | x) = P(c_k) \times \frac{P(x|c_k)}{P(x)}$
と書きますね。
$P(x|c_k), P(c_k), P(x)$がわかれば$P(c_k|x)$がわかるわけだけど、あいにく$x$がとりうる値は天文学的な数がある。そこで登場するのが、
$P(x | c_k) = \prod_j P(x_j | c_k)$
としようというアイデア。文書タイプ$c_k$のもとで$x$の各要素は互いに独立だと考えるわけだ。こうして出来上がる分類器をナイーブベイズ分類器という。
分類器の性能は、$P(c_k|x)$の推定値の良さではなくて、$\hat{P}(c_k) \times \prod \hat{P}(x_j|c_k)$が正しい$c_k$において最大となるかどうかによって決まる。
ここでちょっと寄り道して、文書をどう表現するかという話。
情報検索システムのために文章の表現を作るための方法は実にたくさん提案されている。しかし、驚くべきことに、そしていささかがっくりすることに[←ほんとにこう書いてある]、言語学的知識や領域知識ぬきの構造的に単純な表現、すなわちbag of wordsをつくっちゃったほうがうまくいく模様である。なので、ここでもそう考えます。
さて。
文書がある単語を持つかどうかを二値変数$x_j$で表すとしよう。この場合、ナイーブベイズはもっと簡単に書けて[...中略...]、結局は下式となる。$p_{jk} = P(x_j = 1 | c_k)$として
$\log P(c_k|x)$
$= \log P(c_k)$
$+ \sum_j x_j \log (p_{jk}/(1-p_{jk}))$
$+ \sum_j \log(1-p_{jk}) $
$- \log P(x)$
最後の$\log P(x)$はどこのクラスでも同じだから、ふつうは無視する。
もし2クラスだったらもっと簡単になって... [数式略]
情報検索ではこのモデルを「二値独立モデル」という。二値独立モデルは、検索結果の上位項目に対して検索ユーザが関連性をフィードバックし、その判断を学習してランキングを改善する際に使えないかというので関心が持たれた。
二値独立モデルはいまではほとんど使われていない。その理由は、語の頻度を無視している点にある。文書の長さを無視しているという問題もある。
そこでいろんなバリエーションが提案された。
- 語の有無じゃなくて頻度を入力するという方向。頻度の統計的分布としては、ポワソン分布、ポワソン混合分布、負の二項分布などが検討された。たくさん研究が出たけど、結局のところ、二値独立モデルよりも優れているとはいいにくい。
- 多項モデル。語彙数を$d$として、長さ$f$の文書は$d$カテゴリの多項分布からの$f$回の独立なドローだと考える。文書の長さをうまく扱っているという長所もある。いっぽう、同じ単語が二回でてくるのを独立なドローと捉えるという奇妙があって、長い文書の事後対数オッズがすごく極端になりやすく、ランキングには向かない。というわけで、文章分類には使われているけど文書検索には用いられていない。
- 分布に頼らないアプローチ。確率的インデキシングというアプローチでは、文書の理想的な二値インデキシングがあると仮定し、観察されたインデクス語の生起はそのエビデンスだと捉えて事後対数オッズの期待値を求める。理想のインデキシングの確率はアドホックに計算する。[←よくわからん...] ほかにも、なんらかのノンパラメトリックなモデルで、特定の長さを持つ文章においてある語の頻度が観察される確率を求めるというアプローチもある。情報検索ではあんまりつかわれていないが今後有望。
さて、ナイーブベイズ分類器における独立性の仮定はそもそも不自然なわけで、これをなんとかしようという研究もある。3つの方向がある。
- 独立性の仮定を緩和する。機械学習ではどうだか知らんが情報検索ではうまくいってない。
- 独立性の仮定が不自然でないような特徴集合をつくる。その成否は判断が難しい。そういう提案はたくさんあるけど(たとえば句の生成)、ふつうは独立性の確保以外になんらかの固有の目的があるからだ。ともあれ、改善されたとしてもたいした効果ではない。
- なぜ独立性の仮定が本当は大事じゃないかを説明する。Cooperという人いわく、2クラスのナイーブベイズモデルでは、独立性の仮定は次の弱い仮定に置き換えることができる。
$\frac{P(x|c_1)}{P(x|c_2)} = \prod_j \frac{P(x_j|c_1)}{P(x_j|c_2)}$
彼はこれを"linked dependence"仮定と呼んでいる。
機械学習の分野では、独立性の仮定が破られているさまざまな状況でも、ナイーブベイズの仮定に基づく訓練手続きによって最適な分類器をつくることができるという理論的・実験的証拠が蓄積されている。Domingos & Pazzani (1997, Machine Learning)をみよ。[←へーそうなんすか]
云々。
論文:データ解析(2015-) - 読了:Lewis (1998) ナイーブベイズ、四十にして惑わず
Naik, P.A., Raman, K. (2003) Understanding the impact of synergy in multimedia communications. Journal of Marketing Research. 40(4), 375-388.
仕事の都合で大急ぎで読んだ奴。
いわく。
本論文の目的は、マルチメディア・コミュニケーションにおけるシナジーの効果を実証し、理論的に分析すること。ここでいうシナジーとは、複数のマーケティング活動(たとえばテレビCMと雑誌広告)を併せた効果が、個々の効果の和を上回ることである。
先行研究。
- マーケティング変数間の交互作用は、そもそもマーケティング・ミクスという概念そのものの基盤となるテーマであった。実証研究の歴史も長い。広告の効果と製品品質改善の効果の交互作用とか。Gatignon(1993, in Handbook of OR and MS)のレビューをみよ。
- いっぽうマルチメディア・コミュニケーションにおける交互作用については研究が少ない。Montgomery & Silk (1972, MS)はコミュニケーション・ミクスという概念を打ち出していて、交互作用に注目しているんだけど、あいにく実証はしていない。実証研究の最初期はJagpal(1981, JAR)だが、あいにくキャリーオーバーを無視している。
- かつて英国でラジオ局のコンソーシアムが"Image Transfer Study"というフィールド研究をやって、テレビCMで作られたイメージをラジオ広告が強化するという結果を示している。また実験室実験ではEdell & Keller(1999, MSI Working Paper)がテレビCMと紙媒体の広告との交互作用を調べている。
- 広告投資の研究では、営業と広告の交互作用を組み込んだ規範モデルもある。Gatignon & Hanssen (1987 JMR), Gopalakrishna & Chatterjee(1992 JMR)。
モデル。
とりあえずはAR(1)からスタートします。時点$t$における売上を$S_t$, 広告投資を$u_t$として
$S_t = \alpha + \beta u_t + \lambda S_{t-1} + \nu_t$
とする。$\alpha = E[S_o] | u_{t < 0}=0$, $\beta$は短期効果, $\lambda$はキャリーオーバー効果。$\nu_t$は正規誤差としましょう。
かつてMontogomery & Silkはこう考えた。活動が$u$と$v$の2種類あるとして
$S_t = \alpha + \beta_1 u_t + \beta_2 v_t + \lambda S_{t-1} + \nu_t$
JagpalやGopalakrishna & Catterjeeはさらに交互作用を入れた。
$S_t = \alpha + \beta_1 u_t + \beta_2 v_t + \kappa u_t v_t + \lambda S_{t-1} + \nu_t$
本論文ではこの路線で行きたい。ここでいくつか注釈。
- 最初にAR(1)なモデルを組んだけど、その背後にあるメカニズムとして2通り考えられる。(1)Koyckモデル。最初の効果は$\beta$, 次の期の効果は$\lambda \beta$, 次の期の効果は$\lambda^2 \beta$, ...と考える。(2)partial adjustment model。マネージャは目標売上$S^\#_t$を目指して広告を打つ。その結果、売上は$S_t - S_{t-1} = (1-\lambda)(S^\#_t - S_{t-1})$だけ伸びる。ARモデルはこの結果を$S^\#_t$なしで見ているのだ、という説明。どちらの理屈を採るかで誤差項が変わってくる。前者だと誤差は系列相関を持つが後者だと持たない。
- Gatignon&Hanssensの発想は、マネージャーのアクションはマーケットのアウトカムに影響するだけでなく、マーケティング活動の効率性にも影響する、というものであった。そこで彼らはプロセス関数$\beta_1 = \beta_1' + \kappa v_t$を考え、これをモデルにいれた。そのせいで交互作用項が生まれたのである。この発想でいうと交互作用項には誤差項がない。[←ちょっと待って、このくだり、よくわからない...]
- ラジオ局のフィールド実験などを鑑みるに、いろんなメディアがお互いにイメージを強化しあって、交互作用が生まれているんでしょうね。
- もしかすると「どのメディアによって作られた$S_{t-1}$か」でキャリーオーバー効果$\lambda$が変わってくるのかもしれないじゃん、と査読者に指摘されたんだけど[...中略...]
- 広告の目的は顧客のリテンション率を上げることだろう、というわけで、$S_{t-1}$と広告の交互作用を考えるという拡張もありうる。これは実際に検討します。
- このモデル、OLSじゃだめなんで、カルマンフィルタで推定します。
実証分析。
リーバイスにご協力いただき、Dockersというブランドの"Nice Pants"広告キャンペーンについて分析する。1994-1997の47ヶ月のデータを貰った。
上述のモデルに6月効果、7月効果、12月効果、1月効果の4つのダミー変数を追加したモデルを推定する。
具体的にはどうやるかというと... [以下、ちょっと細かくメモする]
季節効果のダミー変数は観察方程式のほうに入れる。以下では遷移方程式[状態方程式のことね]について説明する。
売上個数$S_t$を、TV広告による売上$S_{1,t}$, 紙媒体広告による売上$S_{2,t}$, シナジーによる売上$S_{3,t}$の3つに分解しておいて[つまり売上という一本の観察時系列の背後に3本の状態時系列を考えるわけね]、
$S_{1,t} = \lambda S_{1,t-1} + \beta_1 u_t + \nu_{1t}$
$S_{2,t} = k\lambda S_{2,t-1} + \beta_2 v_t + \nu_{2t}$
$S_{3,t} = \lambda S_{3,t-1} + \beta_3 \kappa u_t v_t + \nu_{3t}$
ただし$\nu_{it}$も$N(0, \sigma^2/3)$に従うとする。
2つめのキャリーオーバー効果に$k$を入れたのは、キャリーオーバーがメディアによって違うかもしれないから。3つの$S_{i,t}/S_t$と3つの$S_{i,t-1}/S_t$がすべて等しいという制約をつけて$k$をグリッドサーチして尤度が最大になる$k$を得た。
$u_t, v_t$はTV支出, 紙媒体支出の平方根とした。
[以下、観察方程式・状態方程式の誤差の分散行列の話と、モデルの対数尤度の式。めんどくさいのでスキップ]
というわけで、推定しました。
シナジー効果$\kappa$は有意でした。
AICとかBICとかでモデル選択したら...[略]
残差の診断したら...[略]
交差妥当化では...[略]
ここからは規範的分析。
時点$t$における利益を$\pi_t$とする。正味現在価値は、割引率を$\rho$として
$ J = \sum_{t=1}^{\infty} \exp(-\rho t) \pi_t$
である。$J$を最大化する媒体計画$\{(u_t, v_t)\}$を考えたい。
[...ここから、決定論的最適制御理論というのでもって解を出すという話になる。読んでも理解できそうにないので大幅に中略して...]
というわけで、ここから次の示唆が得られる。
- 活動の効率性に比例させて、多様な活動に予算配分すべし。
- シナジーが大きいほど、全体の予算を増やすべし。つまり、シナジーがない場合ならば過剰な広告投資だといえる金額でも、シナジーがあるとなるとそうでもない。
- シナジーが大きい程、効率性が高い活動への予算配分を減らすべし(簡単に言っちゃうと、仮に全体予算が1として、交互作用は半々に分配したときに大きくなるわけだから)。もし効率性が同じなら、シナジーの効果を問わず、均等に分配すべし。
- キャリーオーバーが大きいときには全体予算を増やすべし。
- シナジーがなかったら、予算配分の際にキャリーオーバーのことを考える必要はないが、シナジーがある場合は、キャリーオーバーが大きいときほど、効率的な活動に配分する予算を減らすべし。
メディアの数がN個に増えた場合への拡張。[めんどくさいのでパス]
考察。
- 競合の広告に対抗するための予算配分については別の枠組みが必要。
- こういう動的システムには2種類の不確実性がある。観察ノイズと遷移ノイズである[観察方程式の誤差項と状態方程式の誤差項、という意味かなあ]。前者は測定システムの改善に寄り低減できる。最近の研究ではブランド認知トラッキングにおける測定誤差の効果をウェーブレット・フィルタリングでどうにかしようというのがある[←へええ。Naik & Tsai (2000 JMR)というのを読むと良さそう]。いっぽう遷移ノイズは、モデル・パラメータの時間変動とか、ブランド売上に影響するたくさんの小さなイベントのせいで生じる環境的な不定性とかによって生じる。
- 観察された時間間隔がモデルの時間間隔と異なるとき(例, モデルは月次なのにデータは年次)、バイアスや推定効率低下が生じる。これも今後の課題。
- 最初にGatignon & Hanssens のモデルについて触れたけど...[なんだか面倒な話なのでパス]
- メディアの数の増加に増えてパラメータ数が増え、推定しにくくなるし汎化性能が落ちる。現実的な対策としては:キャリーオーバー効果はメディア間で一定とする。因子分析なり主成分分析なりで説明変数を縮約する。情報量規準でもって変数選択する。PLS推定する。[←おおっと... 著者らはPLSを支持する論文も書いている模様。Naik & Tsai (2000 JRSS)]
- 一般論としていえば、自己回帰過程はこういう風に特徴づけられるんだけど
$S_t = f(S_{t-1}, u_1, u_2, \ldots, u_N) + \epsilon_t$
これじゃ推定も分析もできないから、$f(\cdots)$についてなんらかの制約を掛けるわけだ。さて、上の式のすべてを線形に繋いじゃうモデルのことをsingle-indexモデルという(交互作用項なんかをいれてもいい)。これは解釈上便利なのだが、マーケティングへの応用例がない。今後の課題である。[←へえええ!? 意味がわからない。これってごく素直な、最初に思いつくモデルじゃないの? 私が話の趣旨を理解できていないだけだろうか。Naik & Tsai (2001, Biometrika), Leeflang, Wittink, Wedel & Naert (2000 "Building Models fo Marketing Decisions")というのが挙げられている]
結論。
近年のIMCフレームワークというのはシナジー効果を前提にしているし、マーケターや代理店もシナジーという考え方を受け入れているのに、実証研究が少ない。みなさん、メディアの効果を調べるだけでなく、クロスメディア・シナジーも調べましょう。
云々。
。。。いやー、これ、完全に市場反応モデルの話であって、個人レベルでの態度変容における広告媒体間の交互作用の話は全然出てこなかった。思ってたとの違ったんだけど、ま、それはそれで勉強になりました。
2つのメディアの交互作用をカルマン・フィルタで推定するだけかよ、なんだかなー、と思いながら読み進めていたのだが、モデルから逆に最適な投資配分を決める式を導出し、そこから教訓を得る、ってのがこの論文のミソなのね。今時はそんなことができるんすか、すごいっすね、でも正直ついてけない、って感じだ。
論文:マーケティング - 読了:Naik & Raman (2003) 広告媒体間のシナジー効果をカルマン・フィルタで華麗に推定するぜ
« 2017年11月 | メイン | 2018年1月 »