« 読了:Plummer, et al. (2007) 広告・ブランド関与の測定手法集 | メイン | 読了: Interpreting and Using Regression »
2012年6月14日 (木)
Gayo-Avello, D. (2012) "I Wanted to Predict Elections with Twitter and all I got was this Lousy Paper" -- A Balanced Survey on Election Prediction using Twitter Data. arXiv:1204.6441v1
twitterによる選挙結果予測研究のレビュー。4月にarXiv (プレプリントサーバ。もちろん査読なし) に載ったもの。「お好きな方のためにあとで先行研究を挙げるが、ご多忙な読者のために、twitterデータを用いた選挙予測の「現状」に伴う主な諸問題について私が要約しよう」なあんて書いてある。論文というより、カジュアルなメモという感じ。
著者いわく、twitterで選挙結果を予測する先行研究には以下の問題点がある。
- 先行研究はすべてポストホックな分析で、ほんとに予測してる研究は見当たらない。選挙なんて始終やってんだから、実際に当ててみせろよ、とのこと。
- 当否予測のベースラインには、現職有利であることを組み込むべきだ。"Apply that baseline to prior elections; if your method’s performance is not substantially better than the baseline then, sorry, you have a convoluted Rube Goldberg version of the baseline." 調べてみたら、ウォレスとグルミットに出てくるような無駄に複雑なマシーンのことをRube Goldberg machineというのだそうだ。
- twitterにおける「票の数え方」が恣意的。
- 予測結果を現実の選挙のどんな結果と比べるかが恣意的。
- センチメントの分析がブラックボックス。
- すべての呟きを信頼して分析している。スパムやプロパガンダだってあるだろうに。
- ユーザのデモグラフィック特性を無視している。
- 政治的にアクティブな層のみが呟いているだろうに、そのことを無視している。
後半は先行研究17件をコメントつきで列挙。面倒なのでパスしたが、発表媒体は学会のProceedingsがほとんどで、さすが工学系という感じ。International AAAI Conference on Weblogs and Social Media というのが多かった。
なんだかしらんが、頭もよくて威勢もよい若い人たちがガンガンやってる分野なんだろうなあ。くわばらくわばら。
論文:マーケティング - 読了:Gayo-Avello (2012) twitterによる選挙結果予測はくだらない(いまのところ)