2016年5月30日 (月)
原稿準備のためにとったメモ:
Houtokoop-Steenstra, H. (2000) Interaction and the Standardized Survey Interview: The Living Questionnaire. Cambridge University Press. Chapter 9. Implications for survey methodology.
1. イントロダクション[略]
2. 診断の道具としての会話分析
調査回答場面の録音をつかった行動コーディング研究は、たくさんのインタビューを分析できる反面、現象の原因についてはわからない。いっぽうCA(会話分析)は少数事例の分析であっても、気づかれていない問題を明らかにする。
たとえば質問の曖昧性。先行研究を参照するのも大事だが[Belsonという人の本が挙げられている]、対象者のclarification requestが曖昧性を教えてくれる。Schober & Conrad (1997 POQ)をみよ。
また質問直後の沈黙時間とか、インタビュアーのclarification待ち行動とか、語尾を上げた聞き返しとか、インタビュアーの質問反復とかも役に立つ。選択肢にない反応とかも。インタビュアーの逸脱や回答候補呈示とかも。集計表ばっかりみてないで、逸脱事例に注目しましょう。
3. 構造的問題の検出
closed questionで、インタビュアーが選択肢を全部読み上げる前に対象者が回答しちゃう事例は危険のサインである。ターンテイキングの構造を変えないといけない。
4. 質問定式化についての新しい問いの生成
CAで問題をみつけ、実験や認知インタビューで詳しく調べる、ということもできる。
5. 柔軟な標準化インタビューの探求
標準化の探求は、すくなくともその目的が調査データの信頼性だけでなく妥当性にもあるとするならば、もはや維持できない。
5.1 調査方法論と導管メタファ
伝統的な刺激-反応モデルは、(1)意図された意味と質問の目的が言語的意味とcoincideすると想定し、(2)対象者が調査者の意味したとおりに設問を解釈すると想定する。これらの想定はM. Reddyいうところの導管メタファに由来している[この本のなかでReddyはここが初出。conduit metaphorってそんなに有名なの?] 導管メタファの最大の問題点は、意図された意味と解釈との関係である。対象者は調査者の意図とは異なるやりかたで質問の意味や目的を解釈する。
対象者に同じ質問文を提示することではなく、同じ「意図された意味」を提示することを目指すべきだ。それが抽出できない対象者に対しては、インタビュアーは調査者のスポークスマンとしてふるまうようにトレーニングすべきだ。
5.2 インタビュアーが質問と回答について議論するのを許容せよ
インタビュアーはスポークスマンなんだから、質問の意味と対象者の回答について議論してもよいことにしよう。[ここでSchober & Conrad の実験の紹介]
5.3 インタビュアーにフォーマット化されていない回答を受容させよ
[節タイトルのとおりの内容]
5.4 インタビュアーが推論を引きだし検証するのを許容せよ
インタビュアーが推論を許されていないということが対象者にはなかなかわからない。推論を許し、検証させよう。たとえば「私の夫が...」というセリフが出てきた後では、対象者は既婚だと推測してよいことにし、未既婚の質問では既婚であることを確認することにしよう。
5.5 対象者にルールを説明せよ
最初にインタビュー特有のルールを対象者に教示するという手もある。ただし、(1)いやになっちゃって回収率が落ちるかも。(2)従ってくれないかも。
5.6 標準化されたインタビュー・ルールはインタビュアーに問題を突きつける
インタビューの標準化されたルールに本当に従っていると、インタビュアーは無礼なアホにならざるを得ない。インタビュアーがルールを守らないのはもっともだ。
6. 柔軟なインタビューのコスト
柔軟なインタビューの欠点: (1)インタビュアーの行動の評価が困難になる。データの妥当性向上がそれに見合うのならばそれで良し。見合わない場合は、インタビュアーの評価なんてどうでもいいんじゃないかということになるかもしれない。(2)インタビュアーのトレーニングが大変になる。(3)柔軟なインタビューには時間がかかる。これらも、データの妥当性向上がそれに見合うかどうか次第である。
論文:調査方法論 - 読了:Houtkoop-Steenstra(2000) 生きている調査票 9章 調査方法論に対する含意
原稿の都合で読んだ論文を記録しておく。
Kiousis, S. (2002) Interactivity: a concept explication. New Media and Society, 4(3), 355-383.
相互作用性という概念についてのレビュー論文。掲載誌についてはよくわからないが(Webcatでは所蔵館数5)、google様的には引用元537件、この分野にしちゃ多いと思う。
長い論文で、特に後半はちゃんと読めてないけど、時間が無い。コミュニケーション研究における相互作用概念の先行研究レビューのみメモ。相互作用性についての定義を片っ端から集め、強調するのは(1)技術か、(2)コミュニケーションセッティングか、(3).知覚者か、に注目する。
- サイバネティクス。相互作用性とはチャネルの属性であった。(2)ですね。
- 80年代、PCなどニューメディアの登場とともに出てきた、三次依存性という議論。たとえば「5分前に今夜映画に行きたいって言ってたのに、なんで気が変わったの?」「変わってないよ、2分前にあなた明日映画に行きたいって言ったじゃない」というような会話では三次依存性が生じている。相互作用性とはこういう風に互いの談話を制御し役割を交換する程度のことだ、という主張。これも(2)だけど、チャネルじゃなくて関係性に寄っている。この系統の研究者たちは、メディアの内容と心理・行動変数との関係を検討した。技術や個人属性はあんまり重視しない。Rafaeliという人が有名。
- その後コンピュータ科学との関連で、相互作用性を技術の構造とユーザの特性との関係のなかで捉える立場が出てきた。相互作用性とはメディア環境の形式や内容をユーザがリアルタイムに変えられる程度を表す。そのスピードやレンジやらが増えるとより相互作用的になるって考えるわけだ(とはいえ、たとえばIDEOによれば最新鋭のテレビでもユーザは少数の機能しかつかっていないのだそうで、過ぎたるは及ばざるがごとし、というような面も考慮する必要がある)。こういう立場の人は、相互作用性をさらに細かく操作的に定義したりしているのだが、三次依存性といった系統の相互作用性概念には目もくれない。Steuer, Jensenなど。(1)。
- Durlakという人は技術的観点ではあるがちょっと違った観点からインタラクティブ・メディアを分類している。相互作用性と関連する変数を、相互作用システムの物理的な構成要素として捉える。[←よくわからん] これも(1)。
- 視点かわって、知覚に注目する系統。NewhagenらはNBCニュース視聴者のメールの内容分析の中で、相互作用の知覚という心理学的変数を考えている。この知覚がwebサイトへの態度に影響するという研究もある[←腐るほどありそう...]。(3)。
- ここからは(1)(2)(3)のうち複数を視野にいれている研究。Heeterという人は相互作用性を6次元で定義している: (a)利用可能な選択の複雑さ、(b)ユーザに求められる努力、(c)ユーザに帰せられる責任、(d)情報利用のモニタリング、(e)情報追加の容易性、(f)対人コミュニケーションの促進。(a)(d)(e)(f)が技術、(c)がセッティング、(b)が知覚に近いですね。こういう枠組みはほかにも提案されている[略]。コンピュータに媒介されたコミュニケーションに主な関心を向けている場合が多い。
- 情報が流れるスピードじゃなくて、ユーザから見たタイミングの柔軟性が相互作用性のカギだ、という主張もある由。Downes & MacMillan (2000, New Media & Soc.)。
論文:調査方法論 - 読了:Kiousis (2002) 相互作用性とは何か
2016年5月29日 (日)
雑誌記事の準備のために目を通したんだけど、この章はちょっと事情があってメモをとった(通読するにはあまりに眠かった、というのもひとつの事情)。こういう場合については普段記録してないんだけど、せっかくメモもとったので。
Tourangeau, R., Conrad, F.G., Couper, M.P. (2013) The Science of Web Surveys. Oxford Universicy Press. Chapter 6. Interactive Features and Measument Error.
Webでは多様で豊かなサーベイ・モードが可能になる。本章では相互作用的ケイパビリティの可能性について検討する。
Web調査に相互作用的特徴を導入する理由:
- 技術的にできちゃうから
- いつのまにか相互作用的になっちゃうから。VASをスライダーにした場合とか。
- オンライン調査でしかできないことがあるから[←先生、それは理由になってないような気が...]。インタビュアーのアニメーションを最初に選ばせるとか。
- 他のモードでみられる現象を確認するため。インタビュアーの性別による影響の検討とか。
相互作用的特徴の導入によって、測定誤差の減少などのなんらかの結果が期待されることもある。でもうまくいかないこともある。
1. 相互作用性の諸次元
ここで「相互作用性」とは、dynamicであること、responsiveであることを含む。また、human-likeな相互作用とmachine-likeな相互作用を区別する必要がある。調査三回経験を変えるのは前者である[←云いたいことはわかるけど、ここはちゃんとフォーマルに定義してくれないと困るなあ...]
というわけでdynamic-responsiveとmachine-like - human-likeの2次元を考えよう。ある相互作用的特徴の導入がもたらす結果はこの空間上の位置で決まる。たとえば回答者のパフォーマンスの向上に効果的なのはresponseveでhuman-likeな特徴だ。
2. responsiveでmachine-likeな相互作用的特徴
[以下、個別の要素についての実証研究のレビュー。メモは省略]
- progress indicator [研究が山ほどある...]
- running tallies [チップ・ゲームみたいに数値を入力させたとき、現在の合計が常に表示される奴]
- visual analog scales
- interactive grid [グリッド型の設問で、回答済みの行に色つけるような奴]
- on-demand definition
3. human-likeな相互作用的特徴
- 回答測度を落とすための相互作用的介入。Conrad et al.(2009 AAPOR, 2011 AAPOR): 速く答えすぎた人に「ほんとに読んでんの?」というメッセージを出したら、そのあとは遅くなった[←いやな調査だねえ...]。でも一部のhard-core speedersは遅くならなかった。回答の正確性への影響はあったりなかったり。
- 付加的オープンエンド質問のプロービング。Holland & Christian(2009 Soc.Sci.Comp.Rev.): OA回答後に「なにかほかには」と訊くと回答が長くなる。ほかにOudejans & Christian (2010 Chap.)。なんどもやっていると効果は消える模様。
- 主観的回答の督励。DeRoubray & Couper (2012 Soc.Sci.Comp.Rev): DKを選んだ人に「あなたの答えを聞きたいのよ、答えられるんならbackしてちょうだい」とメッセージを出して戻らせる。
- 明確化の提供。Conrad, Schober, & Coiner (2007 App.Cog.Sci.): 回答にある程度時間がかかったら、設問中の言葉の意味をさらに説明する。
- animated faces in the user interface. 実写なりアニメなりでインタビュアーが出てきて動画で質問する。dynamicだがresponsiveにするのは大変。
期待される効果は: (1)関与の向上、(2)自分で読むよりも質問の理解が促進される、(3)最初に好きなインタビュアーを選ばせたら、モチベーションがあがったり自己開示が促進されたりするんじゃないか。
いっぽう、インタビューアー動画を見せることで生じうる問題として: (1)注意が割かれるのでは。(2)社会的存在を感じさせ自己開示が抑制されるのでは。- Conrad et al.(2008 AAPOR): 顔の動きがリアルっぽいと、対象者は質問を聞いているときにうなずいたり合いの手をうったりする。これは注意を表していると考えられる。微笑みも増える。聞き返しが増え、回答の正確性も増す。なお、音声による自然言語理解の機能を組み込むのは難しいので、この実験は「オズの魔法使い」アプローチを採用した。裏に人間の実験者が隠れていて、聞き返しに対して適切な動画を流した。[←ちょっと笑ってしまった...]
- Conrad, Schober, & Nielsen (2011 AAPOR): 最初にアニメのインタビュアーを選ばせた。対象者は同一人種を選ぶ傾向が強かった。
- Fuchs (2009 Soc.Psych.): 実写のインタビュアー動画を提示。性的に敏感な設問への回答にインタビュアーの性別が効いた。
- Krysan & Couper (2003 Soc.Psych.Quarterly.): 政治的設問への回答に、インタビュアーの人種が効いた。
- Lind, et al. (2013 POQ): 動画をみせると社会的に望ましい回答が増えた。[←あ、これ面白いわ]
- Fuchs & Funke (2007 Chap.): text-onlyのほうが社会的存在を感じる。[←どうやって測ったんだろう]
どうやらWeb調査の対象者は努力を最小化しようとする傾向が強いらしい。電話調査ならわからん言葉を聞き返してくるのに、Webでマウスオーバーで言葉の定義がポップアップするようにしてもあんまし使ってくれない。相互作用的特徴を使ってもらうというのがひとつの課題。
相互作用的特徴は回答品質を向上させたりそうでもなかったりする。ショートカット的行動を防止する奴はうまくいくらしいが、繰り返しても大丈夫かどうかは今後の課題。
調査モードの効果を最小限にする調査票を作りたい場合と、とにかくそのモードでベスト・プラクティスを目指す場合とでも話が違う。
。。。なんだかつまらんなあ...と思いながら読み進め(すいません)、途中で気づいたけど、著者らが調査における相互作用性を整理する枠組みとして考えているresponsivenessとhumannessとは、コミュニケーション研究者Kiousisいうところの「相互作用的技術」と「相互作用的知覚」だ。簡単にいっちゃうと、相互作用そのものの様態には注目せず、入力と出力に注目しているわけである。これは私にとってはちょっとした発見であった。なんというか、あのTourangeauさんにして、古き良き認知心理学というか、情報処理アプローチの子供なのだなあ、と... 孤立した個人の入力-情報処理-出力に注目し、相互作用から生じるダイナミクスはなるべく話に持ち込まない、というあたりが...
調査の心理学にはもう一つの流れ、社会学・言語学の会話研究からのアプローチとか、認知心理学だとルーシー・サッチマンの標準化設問批判とか、 そういうオルタナティブがあると思う。Kiousisのいう「相互作用的セッティング」に相当する流れだ。2つの流れはそんなに簡単に融合できるもんじゃない、ってことなのだろう。
論文:調査方法論 - 読了:Tourangeau, Conrad, & Couper (2013) Web調査の科学 6章: 相互作用的特徴
2016年5月28日 (土)
Hatzinger, R., Dittrich, R. (2012) prefmod: An R package for modeling preferences based on paired comparisons, ranking, or rating. Journal of Statistical Software, 48(10).
Rのprefmodパッケージの解説。要は一対比較データを分析するパッケージである。実戦投入前の儀式として読みはじめたのだが、途中で今回は使わないことにしたので、急にやる気が落ちて、適当に済ませてしまった。
どういう話かというと...
いま、$J$個の対象に対する一対比較データがある。以下、モデルとして次の2つを考える。
その1, Bradley-Terryモデル。ペアの勝敗をモデル化する。対象$j$の価値を0以上の値$\pi_j$で表して
$p(j \succ k | \pi_j, \pi_k) = \frac{\pi_j}{\pi_j + \pi_k}$
これを以下のように書き換えることができるのだそうだ[よくわからないけど、素直に信じることにします]。$j$が$k$に勝ったら+1, 負けたら-1をとる$y_{jk}$を考えて
$p(y_{jk}) = c_{jk} \left( \frac{\sqrt{\pi_j}}{\sqrt{\pi_k}} \right)^{y_{jk}}$
ここで$c_{jk}$は定数。
これを対数線形モデルとして定式化してみよう(LLBTモデル)。$j$と$k$を比べた人数を$n_{jk}$として、$y_{jk}$がある値をとる期待度数
$m(y_{jk}) = n_{jk} p(y_{jk})$
について、こうモデル化する:
$\eta_{y_{jk}} = \log m(y_{jk}) = \mu_{jk} + y_{jk}(\lambda_j - \lambda_k)$
なお、$\log \pi = 2 \lambda$となる。
その2, パターン・アプローチ。ペアのセットの勝敗の同時確率をモデル化する。
ベクトル$\mathbf{y} = (y_{12}, y_{13}, \ldots, y_{J-1,J})$について、
$p(\mathbf{y}) = c \prod_{j <k} \left( \frac{\sqrt{\pi_j}}{\sqrt{\pi_k}} \right)^{y_{jk}}$
これも対数線形モデルとして定式化してみよう。期待度数のベクトル
$m(\mathbf{y}) = n p(\mathbf{y})$
について、独立性を仮定すれば:
$\eta_{\mathbf{y}} = \log m(\mathbf{y}) = \mu + \sum_{j=1}^J \lambda_j x_j$
$x_j$と$\mathbf{y}$との関係について説明があるけど、省略...
独立性を仮定せず、交互作用項を入れる定式化も説明してあるけど、省略...
... だんだんめんどくさくなってきたのですっとばすけど、一対比較にタイがある場合にも拡張できる。対象者の群別にパラメータを変えることもできる。$\lambda$の説明変数として人の共変量を投入することもできる。対象の共変量を投入することもできる。ランキングにも拡張できる。Likert型のレーティングにも拡張できる(タイがいっぱいあるランキングだと思えばいいわけだ)。欠損値も扱えるように拡張できる。対象者の潜在クラスを導入できる。
後半はパッケージの紹介と実例。眠くて途中船をこいだりしながらめくった。ま、ほんとに必要になったら読み直せばいいさ。
Bradley-TerryモデルのパッケージはほかにBradleyTerry2, eba, psychotreeというのがあるんだけど、独立性のない奴を扱えるのが(よってレーティング型データなどを扱えるのが)このパッケージの特徴である由。ふうん。
考えてみりゃ、MaxdiffだってBradley-Terryモデルで解けるはずだよな。効用に潜在クラスを入れられるんなら、このパッケージでやってもいいかも。
論文:データ解析(2015-) - 読了:Hatzinger & Dittrich (2012) Rのprefmodパッケージで一対比較データを分析しよう
2016年5月23日 (月)
ちょっとスマホを眺めすぎだと反省し、移動中はせいぜい本を、それもできればフィクションを、読むように心がけているのだけれど、なかなか読めないものだ。
赤く微笑む春 (ハヤカワ・ポケット・ミステリ)
[a]
ヨハン・テオリン,Johan Theorin / 早川書房 / 2013-04-10
スウェーデンの島を舞台にした四部作の三冊目。暗くて重たい小説なのだが、あと一冊でお別れかと思うと、ちょっと寂しい。なんというか、日本人好みなところがあるような気がするなあ。訳者の方は「無常の感覚」と表現していたが、当たっているかも。
靴の話/眼 小島信夫家族小説集 (講談社文芸文庫)
[a]
小島 信夫 / 講談社 / 2015-01-10
ピランデッロ短編集 カオス・シチリア物語 (エクス・リブリス・クラシックス)
[a]
ルイジ ピランデッロ / 白水社 / 2012-07-21
図書準備室 (新潮文庫)
[a]
田中 慎弥 / 新潮社 / 2012-04-27
フィクション - 読了:「カオス・シチリア物語」「靴の話・眼」「赤く微笑む春」「図書準備室」
ブッダが説いたこと (岩波文庫)
[a]
ワールポラ・ラーフラ / 岩波書店 / 2016-02-17
仏教誕生 (講談社学術文庫)
[a]
宮元 啓一 / 講談社 / 2012-03-13
浄土思想論
[a]
末木文美士 / 春秋社 / 2013-07-22
日本仏教史
[a]
蓑輪 顕量 / 春秋社 / 2015-06-22
哲学・思想(2011-) - 読了:「ブッダが説いたこと」「浄土思想論」「日本仏教史」「仏教誕生」
大人の樹木学 (新書y)
[a]
石井 誠治 / 洋泉社 / 2013-10-05
著者いわく、木の名前に詳しくなる方法のひとつは、庭先で植木を世話している住人を見かけ次第、気軽に声をかけ会話すること、だそうだ。いやー、そんな対人スキルがあったらさ... もっと違う人生送っているよ...
丹下健三――戦後日本の構想者 (岩波新書)
[a]
豊川 斎赫 / 岩波書店 / 2016-04-21
溺れるものと救われるもの (朝日選書)
[a]
プリーモ・レーヴィ / 朝日新聞出版 / 2014-06-10
「憲法改正」の真実 (集英社新書)
[a]
樋口 陽一,小林 節 / 集英社 / 2016-03-17
日本会議の研究 (扶桑社新書)
[a]
菅野 完 / 扶桑社 / 2016-04-30
成熟と喪失 “母”の崩壊 (講談社文芸文庫)
[a]
江藤 淳 / 講談社 / 1993-10-04
村上ラヂオ3: サラダ好きのライオン (新潮文庫)
[a]
春樹, 村上 / 新潮社 / 2016-04-28
途中で気が付いたんだけど、この本、すでに単行本で読んでいた...
ノンフィクション(2011-) - 読了:「成熟と喪失」「丹下健三」「溺れるものと救われるもの」「『憲法改正』の真実」「日本会議の研究」「村上ラヂオ3」「大人の樹木学」
痴女の誕生 アダルトメディアは女性をどう描いてきたのか
[a]
安田 理央 / 太田出版 / 2016-03-30
興味深い本であった。「痴女」「熟女」といった概念がどうやって形成されてきたか、という考察にとても力がはいっているし、また面白い部分でもあったのだが、身体に装着した架空の男性器(張り子)を愛撫された女性が興奮するのをみてAV監督が新シリーズを決断する、というくだりにも不思議な面白さがある。心理学でやるゴムの手の実験を思い切り複雑にしたような話だ。
天正遣欧使節
[a]
松田 毅一 / 朝文社 / 1991-11
単行本を古本屋で入手したが、どうやら講談社学術文庫にはいっている模様。
著者の松田毅一さんは70年代に天正少年使節についての子供向けの本を何冊か書き(私が読んで感動したのもその一冊だったのであろう。「ふたつの使節」という本だった)、そのなかの「天正の少年使節」という本が読書感想文の課題図書に選ばれ二十万部も売れた由。実はそれらはヨーロッパ旅行の資金を貯めるために大急ぎで書いた本で、おかげですごく助かったのだそうだ。よかったですね。
自死: 現場から見える日本の風景
[a]
瀬川正仁 / 晶文社 / 2016-05-10
こどもの自殺、過労死、精神医療における薬害の問題など、それぞれに大きなテーマを一冊に詰め込んでしまって、なんだかピントがぼけちゃったような感じ...
公明党 - 創価学会と50年の軌跡 (中公新書)
[a]
薬師寺 克行 / 中央公論新社 / 2016-04-19
マルクス思想の核心 21世紀の社会理論のために (NHKブックス)
[a]
鈴木 直 / NHK出版 / 2016-01-22
闇経済の怪物たち グレービジネスでボロ儲けする人々 (光文社新書)
[a]
溝口 敦 / 光文社 / 2016-04-19
ノンフィクション(2011-) - 読了:「闇経済の怪物たち」「マルクス思想の核心」「天正遣欧使節」「痴女の誕生」「公明党」「自死: 現場から見える日本の風景」
階級都市―格差が街を侵食する (ちくま新書)
[a]
橋本 健二 / 筑摩書房 / 2011-12-01
興味深い本であった。いくつかメモ:
- 近年の経済的格差拡大の問題にいちはやく気づいていたのは都市問題を研究している人たちで、その代表例がサスキア・サッセンと、マニュエル・カステルという人なのだそうだ。カステルって人の本、面白そうだ、読んでみたい。
- 1925年の「婦人公論」の「塵芥掃溜場から観た新東京」という記事によれば、山の手のゴミには無駄がない。ミカンの薄皮はあっても表皮はない(乾かして蚊をいぶすのに使うから)。いっぽう古い下町のゴミをみると、まずいミカンは食べ残して捨ててある。新しい下町のゴミをみると、ミカンは表皮しかない(薄皮も食べてしまうから)。なお、ここでいう山の手とはプチブル層の住む世田谷・杉並など、古い下町とは日本橋・京橋などの商業地域、そして新しい下町とは本所・深川などの工業地域のこと。現在の「下町」イメージは70年代後半に形成されたものにすぎない。
もっとも、著者の先生には申し訳ないけど、後半の東京フィールドワークで関心を失い、パラパラと流し読みで済ませてしまった。なんというか、東京歴史散歩というような話には全く関心が持てないのである。いずこもいったん全部取り壊して更地にし、同じ規格の集合住宅で埋め尽くしちゃえばいいのに、と思うことさえある。東京に対する反発かもしれないし、もともと地元といえるような場所を持ち合わせていないせいかもしれない。
人はなぜ宗教を必要とするのか (ちくま新書)
[a]
阿満 利麿 / 筑摩書房 / 1999-11
現代人は無宗教じゃもう保たないじゃないかという問題意識を前提に、じゃあどうしたらいいのか考えようという本。具体的には、もちろん仏教の話。
テロルと映画 - スペクタクルとしての暴力 (中公新書)
[a]
四方田 犬彦 / 中央公論新社 / 2015-06-25
鎌倉幕府と朝廷〈シリーズ日本中世史 2〉 (岩波新書)
[a]
近藤 成一 / 岩波書店 / 2016-03-19
ガルブレイス――アメリカ資本主義との格闘 (岩波新書)
[a]
伊東 光晴 / 岩波書店 / 2016-03-19
経済学の本を読んでいるととたんに眠くなる。5分で爆睡できる。でもなぜかわからないが、制度学派ってんだろうか、ヴェブレンとかガルブレイスとか、(ちょっと違うのかもしれないけど)取引コストとか、そういうのだけはすごく面白く感じる。個人的性向の問題なのだけど、いったいなぜこうなっちゃったんだろうか、よくわからない。
寛容論 (中公文庫)
[a]
ヴォルテール / 中央公論新社 / 2011-01-22
ノンフィクション(2011-) - 読了:「階級都市」「人はなぜ宗教を必要とするのか」「テロルと映画」「鎌倉幕府」「ガルブレイス」「寛容論」
Gのサムライ (torch comics)
[a]
田中圭一 / リイド社 / 2016-04-15
web連載時に欠かさず読んでいたんだけど、あまりのバカバカしさに単行本で買ってしまった。
奥付をよく見ると、これ、もとはリイド社の劇画誌(コミック乱ツインズ)に連載していたギャグマンガで、webには再録だった模様。すごくエッジの効いたネット向きのマンガだと感心していたんだけど、最初から意図していたのかなあ。
さらば、佳き日 (2) (it COMICS)
[a]
茜田千 / KADOKAWA/アスキー・メディアワークス / 2016-03-12
めっちゃイケメンの兄とめっちゃ可愛らしい妹の禁断の恋を抒情的に描く。死ねって思いながら読んだ。
ふしぎの国のバード 2巻 (ビームコミックス)
[a]
佐々 大河 / KADOKAWA/エンターブレイン / 2016-05-14
なぜイザベラ・バードの日本旅行記をマンガにしようなどと思い立ったのだろう? 特大ホームラン「テルマエ・ロマエ」もそうだけど、エンターブレインってすごいなあ。
死者の書(上) (ビームコミックス)
[a]
近藤 ようこ / KADOKAWA/エンターブレイン / 2015-08-24
死者の書(下) (ビームコミックス)
[a]
近藤 ようこ / KADOKAWA / 2016-04-25
あ、これもエンターブレインだ。折口信夫「死者の書」のマンガ化。10年くらい前に折口の本を読んだときは、その言語感覚には惹かれたかれど、話の筋はどうもピンと来なかった。こういう話だったのか。独立した作品としてももちろんすばらしいんだけど、著者が謙虚に仰っているように、「鑑賞の手引き」としても面白いと思う。
団地ともお (27) (ビッグコミックス)
[a]
小田 扉 / 小学館 / 2016-03-30
アイアムアヒーロー(20) (ビッグコミックス)
[a]
花沢健吾 / 小学館 / 2016-04-12
東京タラレバ娘(5) (KC KISS)
[a]
東村 アキコ / 講談社 / 2016-05-13
好き嫌いはあろうかと思うが、多くの人の心をどこかで揺さぶるマンガだと思う。共感できるかどうかは別にして、なにか人間の本質的な哀しさ、可笑しさのようなものを描いているように思う。
コミックス(2015-) - 読了:「東京タラレバ娘」「Gのサムライ」「団地ともお」「アイアムアヒーロー」「さらば、佳き日」
たそがれたかこ(7) (KCデラックス)
[a]
入江 喜和 / 講談社 / 2016-04-13
いま一番気になる連載。読むたびに胸が詰まります...
いぬやしき(6) (イブニングKC)
[a]
奥 浩哉 / 講談社 / 2016-04-22
辺獄のシュヴェスタ (3) (ビッグコミックス)
[a]
竹良 実 / 小学館 / 2016-04-12
独身OLのすべて(4) (KCデラックス)
[a]
まずりん / 講談社 / 2016-04-22
それでも町は廻っている 15巻 (ヤングキングコミックス)
[a]
石黒 正数 / 少年画報社 / 2016-04-30
僕だけがいない街(8) (角川コミックス・エース)
[a]
三部 けい / KADOKAWA / 2016-04-27
コミックス(2015-) - 読了:「たそがれたかこ」「いぬやしき」「辺獄のシュヴェスタ」「独身OLのすべて」「それでも町は廻っている」「僕だけがいない街」
朝までに終わるはずの仕事がどうしても終わらないので、せめて読了本の記録くらいはつけておくことにする... まずはコミックスから。
惑わない星(1) (モーニング KC)
[a]
石川 雅之 / 講談社 / 2016-03-23
考えてみればこの人の出世作の設定も途方もないものだったが(菌が喋る)、本作の設定も大変不思議だ(惑星が喋る)。まだ一巻だけど、ついていくのが難しい...
大奥 13 (ジェッツコミックス)
[a]
よしながふみ / 白泉社 / 2016-04-28
リバースエッジ 大川端探偵社 7
[a]
ひじかた憂峰,たなか亜希夫 / 日本文芸社 / 2016-05-09
中間管理録トネガワ(2) (ヤンマガKCスペシャル)
[a]
福本 伸行,橋本 智広,三好 智樹 / 講談社 / 2016-04-06
聖船のラー (1) (ゲッサン少年サンデーコミックス)
[a]
繭住 翔太 / 小学館 / 2016-03-18
パパと親父のウチご飯 2巻: バンチコミックス
[a]
豊田悠 / 新潮社 / 2015-06-09
パパと親父のウチご飯 3巻: バンチコミックス
[a]
豊田悠 / 新潮社 / 2015-11-09
このマンガの設定がいまいちピンとこなかったけど、ようやくわかってきた。事情があって子連れの男二人が同居してるんだけど、いっぽうは優男、他方はこわもて、っていう設定だったんだ! 絵柄では両方ともすっきりしたイケメンなので気がつかなかったよ! どうせなら、ほんとに鬼瓦みたいな顔にすればいいのに。
コミックス(2015-) - 読了:「大奥」「惑わない星」「リバーズエッジ 大川端探偵社」「中間管理職トネガワ」「聖船のラー」「パパと親父のウチご飯」
そういえば、ずっと前にこんなメモを作ったんだった...
別に自分がどんな映画が好きなのか宣伝したいわけじゃないんだけど、昨年日本公開されたテディ・チャン監督の 「カンフー・ジャングル」はとても気に入った。なんというか、去りゆく香港カンフー映画の時代への暖かい挨拶というか、ちょっと郷愁に駆られるような、よい映画です。
この映画、 エンド・クレジットの直前に"The producers wish to dedicate this film to..."という前置きで、カメオ出演した大物や本作スタッフなど、 たくさんの香港映画人が次々に紹介される。しかしながら、残念なことにほとんどの人物が誰だかわからないわけで、劇場で観ている際は、ちょっと取り残されたような気持ちであった。
あ、youtubeにあがっていた..せっかく調べたのに... (涙)
先日DVDを買っちゃって、横目で繰り返し見ながらPCに向かい、誰が誰だか逐一調べてしまった。メモまでつくったので載せておく。
いえ、私も別にそんなにヒマなわけじゃないんですけどね。(説得力なし)
主なデータソースはIMDBです。きっと誤りもあるかと思いますです。
- 入れ墨屋の壁の映画ポスター: 「ドラゴン危機一発」。主演はもちろん、李小龍 Bruce Lee。
- 最初の殺人現場でロク警部(チャーリー・ヤン) に「弾倉はカラだった」という警官: 劉偉強 Andrew Lau。監督(「インファナル・アフェア」)。ちなみに、冒頭でロク警部たちに挨拶するのはこの映画の監督である陳徳森Teddy Chanではないかと思うのだけれど...
- カメラマン: 鄒連友 Davy Tsou。クレジット上はLin Yau Tsouとなっている。この映画の3rd unit cameraman。
- 燕のレプリカの由来を教えてくれる老人: 徐小明 Siuming Tsui。監督(「天山回廊 ザ・シルクロード」)、プロデューサー。
- ロク警部が最初に刑務所を訪れた際に警部を案内する看守: 鄭保瑞 Soi Cheang。俳優(「PTU」), 監督(「モンキー・マジック」)。
- 灰色のポロシャツを着た男: 鄒林 Chow Lam。この映画のgaffer(照明主任)。
- ロク警部の後任の嫌味な感じの刑事: 郭子健 Derek Kwok (aka. Chi-kin Kwok)。監督(「全力スマッシュ」)。
- ラム警部が刑務所に向かう途中でカーラジオから聞こえてくる、脚技の達人の死を報じる声: 呉思遠 Ng See-yuen。プロデューサー(「ワンス・アポン・ア・タイム・イン・チャイナ/天地大乱」)。
- 刑務所のテレビで最初の殺人を伝えるアナウンサー: 章國明 Cheung Kwok-Ming (aka. Alex Cheung)。映画監督(「香港極道 警察」)。
- チャーリー・ヤンにアクションを振り付けている女性: 楊菁菁 Yeung Ching-Ching。この映画のassistant martial arts director。往年のアクション女優(「少林拳対武当拳」)。
- 路上に竹の棒を放置して逃げる無責任な運転手: 羅禮賢 Bruce Law。私でさえ存じあげております、カー・スタントの第一人者。この映画にもcar stuntとしてクレジットされている。
- 警官隊が踏み込んだサウナのTVで流れている映画: 映画「ビースト・ストーカー 証人」。監督は林超賢 Dante Lam。
- テディ・チャン監督の背後で両手に腕を当てて立っている小柄な男性: 吳里璐 Dora Ng。この映画のcostume designer。
- 映画スターであるところの武器の達人が出演する映画を撮っているサングラスの監督: 張同祖 Joe Cheung (aka. Cheung Tung-cho)。監督(「マカオ極道ブルース」)、俳優(「インファナル・アフェア:無間地獄」)。
- 入れ墨屋の壁の映画ポスター: 「蜀山奇傳 天空の剣」。監督は徐克 Tsui Hark、プロデューサーは後出のレイモンド・チョウ。
- かつて武器の達人であった屋台の店主: 姜大衛 John Chiang。旧名David Chiang、70年代ショウ・ブラザース映画の看板俳優。
- 仮釈放中のドニーさんが泊まっているホテルの部屋かなにかで流れている映画:「ドランクモンキー 酔拳」 、成龍 Jackie Chan と袁小田 Yuen Siu-tien の出演シーン。武術の師匠役でなじみ深い袁小田さん、あのユエン・ウーピンのお父さんなんですね、知りませんでした。
- ドニーさんとチャン監督の後ろにいるあごひげの男: 麥國強 Ken Mak (aka. Kenneth Mak)。この映画のproduction designer。
- 美術家であるところの脚技の達人: 釋彥能 Shi Yanneng (aka. Xing Yu)。俳優(「導火線 FLASH POINT 」の悪人三兄弟の末弟)。
- 映画スターであるところの武器の達人: 樊少皇 Louis Fan。俳優(「イップ・マン」の道場破り)。この人、つくづく年齢不詳ですよね...
- 入れ墨師であるところの擒拿術の達人: 喻亢 Yu Kang。ドニー・イェン・アクション・チームの主力メンバー。
- トランシーバーで喋っている男: 郭文奇 Kwok Man-ki。この映画のfirst assistant director。
- ドニーさんにマッサージしてもらっている、娘の仇を討った際の古傷が痛む囚人: 黃志強 Kirk Wong。監督(「ガンメン 狼たちのバラッド」)。俳優としても出演作が多く、ツイ・ハークの「ロボフォース 鉄鋼無敵マリア」に出ているらしい。この映画、ずっと前から観たくてたまらないのだが...
- 最初の殺人現場の検死官: 金培達 Peter Kam Puit Tat。この映画の音楽。作曲家(「孫文の義士団」)。
- ドニーさんに理由無く喧嘩を吹っかけられた挙句、腹をしたたかに殴られる可哀想な囚人: 孟海 Mang Hoi。俳優(「蜀山奇傅 天空の剣」)。
- トラックの前にいるカメラマン: 張文寶 Man Po Cheung。この映画の3rd unit cameraman。
- その左でカメラを操作している人: 黄永恆 Horace Wong (aka. Wing-Hang Wong)。この映画のdirector of photography。なんということだ、ジョン・ウー「男たちの挽歌」「狼」「ハードボイルド」の撮影監督ではないか!
- フォンが住んでいたアパートの大家: 楊盼盼 Sharon Yang (aka. Pan Pan Yeung)。かつてのカンフー・スターだそうだ。
- 入れ墨屋の壁の映画ポスター: 「片腕必殺剣」。主演は王羽 Jimmy Wang-Yu、監督は張徹Chang Cheh、プロデューサーは邵仁枚 Runme Show。
- フォン(ワン・バオチャン)の名前のみならず、彼のアパートの所在地まで知っている大変都合の良い老人: 袁祥仁 Yuen Cheung-Yan。監督、俳優、スタントマン。ユエン・ウーピンの弟さんだそうだ。
- 訴えかけるドニーさんに、紅茶とトーストも用意しますかと嫌みを言う看守: 李達超 Lee Tat-chiu。アクション監督、俳優(「ゴッド・ギャンブラー」)。
- ニキビの看守: 伊诺 Enoch Chan。この映画のvisual effects supervisor。このシーン、本編にはないような気がする。
- 訴えかけるドニーさんに、明日テレホンカードを買えという看守: 梁小熊 Tony Leung。「イップ・マン」のアクション振付としてクレジットされている。
- 極悪非道な格闘家に殺されるキックボクサー: 近彼岸 Bey Logan。脚本家、プロデューサー。著書に"Hong Kong Action Cinema"がある。
- ドニーさんが「人を殺しちゃいました」と自首してきたので電話を掛ける当直警官 : 陳偉雄 Steve Chan。音響効果(「アイアン・フィスト」)。
- ドニーさんが「人を殺しちゃいました」と自首してきたときの黒縁眼鏡の当直警官: 黃偉輝 Wong Wai-fai。スタント(「グリーン・デスティニー」)。
- ロク警部に電話でプレッシャーをかける総監: 曽景祥 Kinson Tsang。この映画のsound designer。
- ワン・バオチャンにメイクしている男: Mark Philip Garbarino。この映画のspecial make-up artist。
- ドニーさんがロク警部の銃を奪ったときにロク警部の背後でびっくりしている警官: 姚文基 Yiu Man-kei。俳優。「冷たい雨に撃て、約束の銃弾を」にクレジットされているが、どの役だったのかわからない。
- 最初の殺人現場で「運転席にドラッグが」と報告する女性警官: 周淑慧 Chow Suk-Wai: (aka. Apple Chaw)。女優、スタント。
- かつての武器の達人がやっている屋台でつけっぱなしになっているTVで流れている映画: 映画「セブン・ソード」より、劉家良 Lau Ka-Leung の出演シーン。
- 美術館でのアクションを振り付けている人: 董瑋 Stephen Tung Wei (aka. Wei Tung)。この映画では香港動作特技演員公會としてクレジットされている。著名なアクション監督として名前を聞き覚えていたが、このたび顔をみてはじめて気が付いた。なんと、ジョン・ウー「ハード・ボイルド 新・男たちの挽歌」で無惨に殺される情報屋ではないか!懐かしい!
- ドニーさんに頼まれてロク警部に電話してくれるトラック運転手: 元彬 Yuen Bun。この映画のmartial arts director。入れ墨屋でのアクションを振り付けている由。
- 事件終結後、ロク警部が訪ねてきたとドニーさんに知らせる看守: 厳華 Yan Hua。この映画のmartial arts director。イェン・アクション・チームの主要メンバーにして、「スペシャルID 特殊身分」ではむやみに絶叫するギャング。
- ケーキの横の女性: 被嘉珍 Catherine Hun。この映画のproducer。
- アクションスターである武器の達人の死因について説明する監察医: 林迪安 Dion Lam。アクション監督(「インファナル・アフェア」)。
- ドニーさんにマッサージしてもらったが右肩は揉んでもらえなかった囚人: 陳會毅 Chan Fu-yee (aka. Billy Chan Wui-ngai)。往年のアクション・スターで、「ドラゴン危機一発」やキン・フー「侠女」にもクレジットされている模様。へぇー。
- 記者会見でラム警視に「僕も詠春拳を習ったけど命を狙われるか」と問う記者: 司徒慧焯 Roy Szeto。脚本家(「スウォーズマン 女神復活の章」)。
- 記者会見でラム警視を問い詰めるものの、隣の記者がアホなことを言うので笑いだす記者: 陳淑賢 Susan Chan。脚本家(「桃さんのしあわせ」)。
- 金網に向かって立ち、突然目を見開く囚人: 劉浩良 Lau Ho-leung。この映画の脚本。なお、このシーンは映画本編に見当たらないけど、刑務所の格闘シーンでお姿がちらりと拝見できるように思う。
- 身振り手振りでアクションを指導している男: 甄子丹 Donnie Yen。この映画の主演かつaction director。宇宙最強。
- かつての武器の達人がやっている屋台の客の老人: 鄒文懐 Raymond Chow。ゴールデン・ハーベスト創立者、香港映画の黄金期を支えた大物。
雑記 - 映画「カンフー・ジャングル」に登場する香港映画人たち
2016年5月22日 (日)
先週都合により目を通した論文のメモをのせておく。ほんとはそれどころじゃないんだけど...
Rossi, P., Gilura, Z., Allenby, G.M. (2001) Overcoming Scale Usage Heterogeneity: A Bayesian Hierarchical Approach. Journal of the American Statistical Association, 96(453), 20-31.
調査票に5件法の項目をずらっと並べたところ、回答をみると妙に右側にばかりマルしている人もいれば妙に左側にばかりマルしている人もおり、これはいかなる前世の因縁かとくよくよ思い悩む世界1000万人のリサーチャーを憐れみ、ベイジアン・モデリングのビッグ・スターAllenby兄貴とその仲間たちが授ける必殺の階層ベイズモデル。(必殺でもないかも。憐れんでもいないかも。1000万人もいないかも)
仕事の都合で急遽目を通した。兄貴の主著"Bayesian Statistics and Marketing"(以下BSM本)のCase Study 3とほぼ同じ内容だと思うのだが、同じのを二度読むのもなんだか癪にさわったし、本を持ち歩くのは重かったので。
前置きは省略して、いきなりモデルにはいると。。。
対象者 $i$ ($N$人) の項目 $j$ ($M$個) への回答の背後に連続的潜在変数$y_{ij}$を仮定する。全部$K$件法だとして、閾値$c_0, \ldots, c_K$を仮定し、$c_0 = -\infty, c_K=\infty$とする。[ここでは閾値が全員共通だと考えている点に注意]
ベクトル$y_i = [y_{i1}, y_{i2}, \ldots, y_{iM}]'$について$y_i \sim N(\mu^*_i, \Sigma^*_i)$と仮定する。
[えーっと... ここまではまだ、潜在変数が回答に落ちる仕組みの話であって、潜在変数の生成についてはなんら語ってないわけね]
で、$y_i$についてこうモデル化する。
$y_i = \mu + \tau_i \iota + \sigma_i z_i, \ \ z_i \sim N(0, \Sigma)$
よって$\mu^*_i = \mu + \tau_i \iota, \Sigma^*_i = \sigma^2_i \Sigma$である。で、尺度の左端につけやすい人は$\tau_i$が大きく$\sigma$が小さい人、両極につけやすい人は$\tau_i$がゼロで$\sigma$が大きい人、という風に考える。
[注目!ここでいう$y_i$は態度のベクトルではなくて、態度と回答スタイルをコミにしたベクトルなのだ。$M$個の回答の背後にある態度ベクトルの分布としてまず多変量正規分布 $N(\mu, \Sigma)$を考え、$i$さんの潜在ベクトルの分布はそれを$\mu$から$\sigma_i$倍して$\tau_i \iota$ずらしたものだ、と考えるわけね]
あるいはこう考えてもよい。上では閾値を全員共通に$c_1, \ldots, c_K$と捉えたが、$y_i$の分布は全員で共通と考え、閾値の側に個人差があると捉えて
$c^*_i = \tau_i + \sigma_i c$
これでも結局は同じことになる。[そうやね、こっちのほうがわかりやすいわね]
モデルに階層をいれます。
標準的な階層モデルであれば、位置$\tau_i$と尺度は$\sigma_i$はアプリオリに独立で、条件付き共役事前分布に従うと仮定するところだが、ここでは次のように考える。
$[\tau_i, \log \sigma_i]' \sim N(\varphi, \Lambda)$
$\tau_i$と$\sigma_i$が相関を持ちうることに注意。
識別の都合上、$\varphi_1 =0 ,\varphi_2 = -\lambda_{22}$と制約します。$E[\tau_i]=0, E[\sigma_i]=1$としているわけです。
[2018/01/01追記: $\lambda_{22}$とは$\Lambda$の2番目の対角要素であろう。このくだり、この論文を読んだときには疑問に思わなかったのだが、このたび振り返ってみるとよく理解できない。BSM本の該当箇所(p.242)のほうが詳しいし、制約のかけ方が若干変更されているので、訳出しておく]
$\tau_i$を識別するため、制約$E[\tau_i]=0$をかける。$\tau_i$の分布は対称かつユニモーダルなので、この分布の中央値と最頻値もゼロにしたことになる。さて、$\sigma_i$の分布は歪んでいるから、識別制約の選択には十分な注意が必要である。ひとつの論理的な選択は$E[\sigma^2_i]=1$とすることであろう。これは識別制約として$\varphi_2 = -\lambda_{22}$をかけることに対応する。しかし、散らばりのパラメータ($\lambda_{22}$)が大きくなるにつれて、$\sigma_i$の分布は太い右裾を持ちつつ、1より左にある最頻値の周りに集中する。これは事前分布としてあまり望ましいものではない。[...]
もっと理にかなったアプローチは、$\sigma_i$の事前分布の最頻値を1に制約するというものである。これは識別制約として$\varphi_2 = \lambda_{22}$をかけることに対応する。[...] $\lambda_{22}$が大きくなるにつれて、$\sigma_i$の分布は1のまわりに固まるが、右裾が厚くなって散らばりが大きくなる。というわけで、我々は
$\varphi_1 = 0, \varphi_2 = \lambda_{22}$
という識別制約を採用する。なお、Rossi et al.(2001)では平均を1にするという方略を採用していた。
[うううむ。云っている意味はわかったけど、$E[\sigma_i]=1$とするためには$\varphi_2 = -\lambda_{22}$とすればよいという理由がやっぱりわからない。記号のせいでどうも混乱してしまうので、頭の悪い俺のために、$\tau_i$と$\sigma_i$を独立とみなし、$\sigma_i, \varphi_2, \lambda_{22}$をそれぞれ$X, A, B$と書き換えよう。すると
$\log X \sim N(A, B)$
$X$は対数正規分布に従っている。対数正規分布の平均は
$E[X] = \exp(A+B/2)$
だ。$E[X]=1$とするためには$A + B/2 = 0$、つまり$A = -B/2$とすればよい。もとの記号に戻すと$\varphi_2 = -\lambda_{22}/2$となる。あっれーーー? どこで間違えたんだろう?]
閾値のほうは、$\sum_k c_k = m_1, \sum_k c^2_k = m_2$と制約します。さらに、$c_k = a + b k + e k^2$という制約も入れ、自由パラメータを$e$だけにします。[細かいところよくわかんないけど、後者の制約はちょっと勘弁してほしい... 前者の制約だけで自由パラメータは$K-2$個になる模様だ、5件法とかならもうそれで十分じゃん]
最後に、事前分布の導入。
$\pi(\mu, \Sigma, \varphi, \Lambda, e) = \pi(\mu) \pi(\Sigma) \pi(\varphi) \pi(\Lambda) \pi(e)$
として...
2018/01/01追記: ここからは、この論文のメモから離れ、この論文、BSM本、Rのbayesm::rscaleUsage()のマニュアル、の3つを比較してみる。
- 潜在変数の平均ベクトル$\mu$の事前分布$\pi(\mu)$について。
- この論文: $\pi(\mu) \propto constant$
- BSM本: $\pi(\mu) \propto constant$
- bayesm::rscaleUsage(): $\mu \sim N(mubar, Am^{-1})$; mubarのデフォルトはrep(k/2, p) (kは段階数, pは項目数), Amのデフォルトは0.1*I。
- 潜在変数の分散行列$\Sigma$の事前分布$\pi(\Sigma)$について。
- この論文: $\Sigma^{-1} \sim W(\nu_\Sigma, V_\Sigma)$
- BSM本: $\Sigma \sim IW(\nu_\Sigma, V_\Sigma)$
- bayesm::rscaleUsage(): $\Sigma \sim IW(nu, V)$
- $\pi(\Sigma)$のハイパーパラメータについて。
- この論文: $\nu_\Sigma = dim(\Sigma) + 3 = K+3,\ V_\Sigma = \frac{1}{\nu_\Sigma} I$
- BSM本: $\nu_\Sigma = dim(\Sigma) + 3 = K+3,\ V_\Sigma = \nu_\Sigma I$
- bayesm::rscaleUsage(): nuのデフォルトはp+3(pは項目数)、Vのデフォルトはnu*I
仮にそうだとして... $M$次元多変量正規分布の共分散行列の事前分布を$IW(M+3, (M+3)I)$とするというのは、ここに限ったことではなくて、無情報事前分布としては一般的なやりかたらしい。BSM本の2.8.3節。 - 尺度使用の異質性を表すパラメータ$\tau_i, \sigma_i$の平均ベクトル$\varphi$は、この論文では$\varphi = [0 ,-\lambda_{22}]'$, BSM本とbayesmでは$\varphi = [0, \lambda_{22}]'$なので、その事前分布$\pi(\varphi)$については考えなくてよろしい。
- $\tau_i, \sigma_i$の共分散行列$\Lambda$の事前分布$\pi(\Lambda)$について。
- この論文: $\Lambda^{-1} \sim W(\nu_\Lambda, V_\Lambda)$
- BSM本: $\Lambda \sim IW(\nu_\Lambda, V_\Lambda)$
- bayesm::rscaleUsage(): $\Lambda \sim IW(Lambdanu, LambdaV)$
- $\pi(\Lambda)$のハイパーパラメータについて。
- この論文: $\nu_\Lambda = dim(\Lambda) + 3 = 2+3,\ V_\Lambda = \frac{1}{\nu_\Lambda} I$
- BSM本: (長くなるので後述)
- bayesm::rscaleUsage(): Lambdanuのデフォルトは20, LambdaVのデフォルトは(Lambdanu-3)*Lambda, Lambdaのデフォルトはmatrix(c(4,0,0,0.5),ncol=2)
- 閾値のパラメータ$e$の事前分布$\pi(e)$について。
- この論文: $\pi(e) \propto unif[-0.2, +0.2]$
- BSM本: $\pi(e) \propto unif[-0.2, +0.2]$
- bayesm::rscaleUsage(): e $\sim$ unif on a grid. なお、この点についてはBSM本のp.252に解説がある。いわく、Rの実装にあたっては、$e$の事前分布として、間隔(-0.1, 0.1)におけるグリッド上の一様分布を使い、このグリッドのうえでランダムウォークした。つまり、グリッドの点の右か左に等しい確率で移動した(ただし両端においては内側に移動した)。云々。
BSM本における$\Lambda$の事前分布についての説明。まわりくどくて面倒なので、虚心に丸ごと全訳する。
$\Lambda$の事前分布は、$\tau_i, \sigma_i$の推定値がシュリンクする程度に影響する。我々の階層モデルは、$\tau_i, \sigma_i$の分布についてデータが持っている情報に適応できるが、ただしそれはハイパーパラメータ$\Lambda$の事前分布の支配下での話である。$\tau_i, \sigma_i$の推定値の基盤となる設問は、あまり数が多くないのがふつうだろう。このことは、$\Lambda$の事前分布の影響がきわめて大きくなるであろうということを意味している。階層モデルの多くの適用事例では、十分な量の情報を提供してくれるユニットのサブセットが存在し、このサブセットのおかげで、適応的シュリンケージによって$\Lambda$を決定できる。しかし我々の状況では、こうしたサブセットを利用することができず、$\Lambda$の事前分布が通常よりも大きな影響力を持ちうるのである。以上の理由により、$\Lambda$の事前分布の選択には注意が必要である。また、ここで検討・提案する事前分布のセッティングは、階層モデルの文脈で通常用いられるものよりも幾分タイトなものになる。
$\Lambda$の事前分布の役割は、$\tau_i, \sigma_i$の事前分布を導出することである。事前分布のハイパーパラメータの選択が持つ含意について検討宇するために、$\tau_i, \sigma_i$の周辺事前分布をシミュレーションで計算してみよう。周辺事前分は下の式で定義される。
$\pi(\tau, \sigma) = \int p(\tau, \sigma | \Lambda) \pi(\Lambda | \nu_\Lambda, V_\Lambda) d\Lambda$
$\nu_\Lambda, V_\Lambda$について評価するために、$\tau_i, \sigma_i$がとりうる値については幅広く検討するが、事前分布の分散については許容可能な範囲より大きくならないように制約する。$\tau$については範囲を$\pm 5$とする。これは10件尺度の大部分を包含するという意味で非常に幅の広い範囲である。$\sigma$については、このパラメータによって潜在変数が取り得る値の範囲がどのように制約されるかといを考えないといけない。$\sigma$が小さいということは、回答者が尺度のうち狭い部分しか使わないということを表し、$\sigma$が大きいということは、回答者が尺度の全体を使うということを表す。いま、「小」尺度使用者(たとえば、下の3段階とか、上の3段階とかしか使わないような人)、「中」尺度使用者(10件法で5段階しか使わない人)、「大」尺度使用者(尺度の両端を使う人)がいるとしよう。「中」使用者のSDに対する「小」使用者のSDの比は、$\sigma$の「小さい」値に対応するだろう。また、「中」使用者のSDに対する「大」使用者のSDの比は、$\sigma$の「大きい」値に対応するだろう。このように考えると、$\sigma$の範囲は幅を広く取って(0.5, 2)程度だといえるだろう。そこで次のセッティングを採用する。これは$\tau_i, \sigma_i$についての比較的に情報的な事前分布に対応している。
$\nu_\Lambda = 20, \ V_\Lambda = (\nu_\Lambda - 2 - 1) \bar{\Lambda}$
$\bar{\Lambda}$は2x2の対角行列で、対角要素は[4, 0.5]とする。
このセッティングは、$E[\Lambda]$が$\bar{\Lambda}$にほぼ等しいことを保証する。$\tau_i, \sigma_i$の周辺事前分布は、変に大きな値を取ることなく、適切な範囲をカバーする。
やれやれ... 追記はここまでにして、論文のメモに戻る。
....でもって、これをGibbsサンプラーで推定する。[付録に細かいことがいろいろ書いてあるけど、パス]
実例。顧客満足度調査、n=1811, 10件法6項目。このモデルで推定した真値と支出額との相関が高かった、というような話。
... 読みなおしてみて、やっぱり面白い論文であった。Allenby兄貴のチームは、論文は面白いのにね、なんであの本はあんなにわかりにくいんだろうか。
感想が4点。
- こうやって$M$項目の回答データの背後に$M$次元の多変量正規分布を仮定し、尺度使用の異質性を取り除いた真の態度を推定したとして、じゃあどうすんの、と思う。きっと推定したスコアを回帰分析や因子分析や潜在クラス分析にかけることを想定しているのだと思うけれど、そのときにはスコアが多変量正規分布に従うという想定を外すことになるわけだ。ほんとは尺度使用の異質性だけを先にモデリングするんじゃなくて、そのあとで想定するモデルまで全部一発で同時推定したほうがいいんじゃないかろうか。この論文のような二段階アプローチってどこまで許されるんだろうか、その辺のところ、ご専門の方に訊いてみたいものだ。
- scale usage heterogeneityをモデル化する動機はなんだろうか。この論文の理屈では、ほっとくと項目間の共分散行列が底上げされちゃうことが問題なのだろうけれど(そうか、結局この論文はcommon method varianceの話なんだな)、実際の調査データ分析では、CMVそのものを問題にすることより、群間での回答スタイルの差(典型的には国によるちがい)を問題にすることのほうが多いんじゃないかしらん。えーと、そうすると、この論文の枠組みでいえば、上の階層で$\tau_i$と$\log \sigma_i$を群を表す共変量に回帰させればいいんだろうな。正直に言うと、群内の閾値の異質性なんてあんまし関心なくて、Mplusでいえば
MODEL: F1-F3 by u1-u20 (*1);
MODEL US: [u1$1-u20$1 u1$2-u20$2 u1$3-u20$3 u1$4-u20$4];
MODEL JP: [u1$1-u20$1 u1$2-u20$2 u1$3-u20$3 u1$4-u20$4];
...
というような感じのモデルを柔軟に組みたいんだけどなあ(上のコードが正しいかどうかは別にして)。ま、Stanとかで自分でやれってことなんでしょうね。 - いっぽう、尺度使用の記述(?)としてこのモデルを使うのはすごく面白いなあ、と思った次第である。そんなこんなで、k件法尺度の項目をある個数以上聴取したデータを扱うときには、この論文の手法を実装したRのbayesm::rscaleusage()を回してみたりしているんだけど、うーん、どのくらいの項目数があればいいのかしらね。直感としては、項目数が少ないときはうまくいかないだろうと思う。そのへんを教えてくれるとありがたいんだけど。
- ところで、尺度使用の異質性のせいでセグメンテーションにバイアスがかかるという実証研究としてGreenleaf (1992, JMR)というのがあるのだそうだ。回答スタイルの研究については以前原稿の都合でかなり頑張って論文を集めたのに、見落としがあった模様。やになっちゃうなー。[→2018/01/07追記: ちゃんと読んでいた。なんだかなあ]
せっかくなので(なにがだ)、Allenby兄貴の「兄貴」称号の由来となった、香港映画最後のカンフー・スター、ドニー・イェン兄貴の名場面から。日本での最新公開作「カンフー・ジャングル」 (2014, 陳徳森監督)の最後の対決シーンより。
ドニー兄貴の大ヒット作といえば「イップ・マン」シリーズだが、現代劇に限って言えば、本作が兄貴の最高傑作なのではないだろうか。個人的な意見でございますが、回り道をし歳を食い、カンフーこそすごいけれどもちょっとダメなところのある男を演じ始めたとき、ドニーさんは俄然光り輝き始めたように思う。「孫文の義士団」のギャンブル中毒とか。
この映画でいうと、敵役のワン・バオチャンがいかに非人間的なまでに強いかという描写に力を注いだところも勝因だけれど、主演のドニーさんが妹弟子の写真をひそかにスマホの待ち受け画像(?)にしているというあたりが、なんというかその、ぐっとくるわけであります。
(2018/01/01: 大幅に追記した)
論文:データ解析(2015-) - 読了:Rossi, Gilura, Allenby (2001) k 件法項目で高いほうにばかり答える人や低いほうにばかり答える人がいるのをなんとかする
2016年5月21日 (土)
仕事も副業もうまくいかないことばかり、たまにスマホの画面でSNSを開くと、あの人もこの人もみんな立派で有意義な人生を送っておられるので、あわてて目をそらし、沼の泥を掬うような地味な仕事のことを考えるのであった...
DuMouchel, W.H., Duncan, G.J. (1983) Using sample survey weights in multiple regression analysis of stratified samples. Journal of the American Statistical Association, 78(383), 535-543.
調査データの分析の際、標本をウェイティングしている場面(いわゆるウェイト・バック集計をしている場面)で、その標本を使って回帰分析するときはどうすんのさ、という論文。仕事の都合で読んだ。またまた、古い論文を...
シンプルな回帰分析について考えよう。サンプルサイズ$n$、目的変数1個、説明変数$p$個とする。回帰係数の最小二乗推定量は
$\hat{\beta} = (X' X)^{-1} X' Y$
だ。
さてここで、標本の抽出確率が均等でなかったらどうするか。ここでは層別抽出に絞って考える(かつ、$Y$による層別ではないとする)。
ひとつの考え方は、層を無視して上の推定量をしれっと使うというもの。
もうひとつは、多くの教科書に書いてあるんだけど、WLS推定量を使うというもの。層別変数を$\tilde{J}$、層数$k$、母集団における割合$\{\pi_j\}$は既知とする。水準$j$のサンプルサイズを$n_j$とすると、個体$i$に与えるウェイトはそいつが属する層を$j_i$として
$w_i \propto \pi_{j_i} / n_{j_i} $
このウェイトを対角にいれた行列を$W$とする。WLS推定量とは
$\hat{\beta}_W = (X' W X)^{-1} X' W Y$
さあ、どっちを使うべきか? [カーン ←ゴングの音]
この議論、少なくともKlein & Morgan(1951)というのにまで遡るのだそうだ。
「しれっと」派の言い分はこう。WLS推定ってのは誤差分散が等しくない時に使うんであって、この話と関係ないじゃん[←そうそう、俺もそう思った]。誤差分散が等質であるかぎり$\hat{\beta}$は不偏かつ最小分散なのであって、層のサイズがどうなっていようがどうでも関係ない。
いっぽうWLS派にいわせると、抽出スキームのせいでバイアスが生じているはずだから、$\hat{\beta}$はもはや最適でないはずである。どうにかしなきゃ。
著者らいわく。これは結局、母集団についてどう考えるかで決まる問題だ。
4つのモデルを考えよう。
その1, 等質な線形モデル。
$\tilde{Y} = \tilde{X} \beta + \tilde{\epsilon}$
$\tilde{\epsilon}$は平均0, 分散$\sigma^2$の偶然誤差で、$(\tilde{X}, \tilde{J})$とは独立。
その2, 混合モデル。
$\tilde{Y} = \tilde{X} \beta(j) + \tilde{\epsilon}$
$\tilde{\epsilon}$は平均0, 分散$\sigma^2$の偶然誤差で、$(\tilde{X}, \tilde{J})$とは独立。
つまり、$\beta$が層によって違うと思っているわけである。分析者が関心を持つのは、$\beta$の重みづけ平均
$\bar{\beta} = \sum_{j=1}^k \pi_j \beta(j)$
である。
その3、omitted-predictorモデル。
実は、$q$個の変数$\tilde{Z}$があって、
$\tilde{Y} = \tilde{X} \alpha + \tilde{Z} \gamma + \tilde{\epsilon}$
なのだけれど、我々は不幸にして$\tilde{Z}$を持っていない。で、$\tilde{Z}$のうち$\tilde{X}$に直交する部分を取り出して$\tilde{U}$とすると
$\tilde{Y} = \tilde{X} \beta + \tilde{U} \gamma + \tilde{\epsilon}$
なのである。分析者はほんとは$\alpha$と$\gamma$が知りたいんだけど、あきらめて$\beta$を調べているのだ。
その4、一般的な非線形モデル。ないし、モデルなし。
$\tilde{Y} = \tilde{X} \beta^* + \tilde{\epsilon}^*$
$E[\tilde{\epsilon}^*] =0$
$cov(\tilde{X}, \tilde{\epsilon}^*) = 0$
としか想定しない。$(\tilde{X}, \tilde{J})$ で条件づけられた$\tilde{\epsilon}^*$の期待値とか分散とかについてはなあんにも考えてない。
分析者が関心を持っているのは
$\beta^* = E(\tilde{X}' \tilde{X})^{-1} E(\tilde{X}' \tilde{Y})$
である。これは有限母集団を全数調査したときの最小二乗推定値、いわば「センサス係数」だと考えてもよいし、$\tilde{X} \beta^*$が$\tilde{Y}$の最良の線形予測となるような係数なんだと考えてもよい。モデル1,3が正しかったらその$\beta$と等しい。しかし、モデル2が正しいときに$\bar{\beta}$と等しいとは限らない。[←ああ、そうかも... 俄然面白くなってきた。センサス係数は混合モデルの係数の加重和じゃないわけだ]
ところで、モデル3との関係について。$\tilde{U} \gamma + \tilde{\epsilon} = \tilde{\epsilon}^*$だと思えばモデル4と同じことではある。しかしモデル3には、$\tilde{U}$ というか $\tilde{Z}$は本当は観察できたはずの少数の変数なのだ、という含みがある。
さて、WLS推定量$\hat{\beta}_W$を使うべきなのはどういうときか。
- 当然ながら、モデル1が正しいときは使うべきでない。
- モデル2が正しい場合、$\hat{\beta}$も$\hat{\beta}_W$も、$\bar{\beta}$の良い推定量とはいえない。[←なるほどね! ]
- モデル3が正しい場合には$Z$を探すべき。無理な場合にはモデル4。
- モデル4の観点から$\beta^*$に関心があるときは、WLS推定量を使うべき。少なくとも一致推定量ではあるので。
ここからは、モデル1を支持できるかどうかをデータで決めるやり方について考えよう。調べるのは
$\hat{\delta} = \hat{\beta}_W - \hat{\beta}$
もしモデル1が正しければ、$\hat{\delta}$の期待値はゼロ。で...
ここからよく理解できなくなっちゃったんだけど(ちゃんと読んでないからだ、と信じよう)、$Y$の全分散を、{$\hat{\delta}$ で説明できる平方和、ウェイトで説明できる平方和、誤差平方和}に分解するANOVAを考える。結論だけメモしておくと、以下の方法で「ウェイトで説明できる平方和」$SS_W$を求めることができる由。$Z_ij = w_i X_ij$として、$X$と$Z$を説明変数にした$Y$の回帰を求め、ここから$Z$を落としてまた求める。平方和の差が$SS_W$。で、これを$p$で割った値が、帰無仮説のもとで自由度$p$, $n-2p$の$F$分布に従う。
最後に実例。読み飛ばした。
。。。モデル2、すなわち層によって回帰係数がちがうんじゃないかと思っていて、その加重和を推定したいと思っている場合には、OLSだろうがWLSだろうが駄目なんだ、というところが勉強になった。いっぽう、これまでに「ウェイティングして回帰してください」と言われた場面で漠然と想定されていたのはモデル4に近いと思う。
疑問点が2つ。
その1。モデル4の立場で、俺はセンサス係数を知りんたいんだ、と割り切って考えることができる場面とはどういう場面だろうか。推定した係数に対して、層間の異質性を無視して実質的な解釈を与えるならば(そうなることが多いと思う)、それは途中でモデル1に視点をすり替えたことになる。前から思っているんだけど、「データ生成メカニズムがどうなっているのか知りませんけど、とにかく母集団を全数調査したときに得られるであろう係数を推定しました」っていうのは、なんというか、すごく実査担当者的な発想だと思うんですよね。かつて私の上司様がシニカルに呼んでいた、「コンナンデマシタケド」的データ解析だ。 その係数をどう解釈せえというの?という問いに対しては、ごにょごにょと言葉を濁すわけである。胸が痛むので大きな声ではいえないけど、それはちょっと不誠実なんじゃないかしらん。
もっとも、係数を実質的に解釈するつもりがなく、単に「これから同一母集団から単純無作為抽出する標本に適用できる最良の線形予測式」を求めることに関心があるのだ、ということであれば、それはそれで納得するけど。その場合のWLS推定量とは、学習データ(層別抽出)と検証データ(無作為抽出)で層の割合が違うので学習時に修正しておきたい、という話として捉えられるのではないかと思う。
その2。層別抽出においてモデル3ないし4の立場をとったとして、WLS推定量が一致性を持つことはわかったけど、それは最良な推定量といえるのだろうか? もっと良い推定量があったりしないのでしょうか。WLSって、誤差分散の不均一性に対処するために、誤差分散が大きそうな個体に小さなウェイトを与える方法だと思うんだけど、層別抽出の際のウェイトとはあくまで抽出確率の逆数であって、誤差分散とは関係ないと思うんですよね。WLSじゃなくて、個体尤度に重みをつけた最尤法を使うってんなら、なんとなく納得するけど... SASのproc surveyregやRのsurveyパッケージはどうなっているんだろうか、ヒマになったら調べてみよう。
論文:データ解析(2015-) - 読了:DuMouchel & Duncan (1983) 回帰分析も「ウェイト・バック」すべきでしょうか
2016年5月15日 (日)
グローバル・マーケティング時代のマーケティング・リサーチにおいて(←かっこいい書き出し)、リサーチャーを苦しめる新たな難題リストのトップに躍り出たトピックがあると思う。AskingからListeningへとか?ビッグデータ活用とか?まさか。どなたも言わないのでひとりで勝手に呟くけど、 測定不変性(MI)の問題こそがそれだ。巷に溢れる実務家向け参考書のどこにも書いてないのが不思議なくらいだ。そういう本当に深刻な問題には、きっとみなさんご関心がないのであろう。面倒くさいもんね。
このたびもMIの問題で延々悩む事態が生じ、とりあえず知識のアップデートのためにと思って昼飯のついでに手に取ったのだが、いかん、油断していたら、聞いたこともないようなアプローチが出てきている...
van de Schoot, R., Schmidt, P., Beuckelaer, A.D., Lek, K., & Zondervan-Zwijnenburg, M. (2015) Measurement Invariance. Frontiers in Psychology, 6, 1064.
この雑誌のMI特集号のEditorial。まずMIという問題についてごく簡単に触れたのち、MIへのアプローチを4つに整理し、先行研究と掲載論文を紹介。
MGCFA。70年代のJoreskog, Sorbom に始まる伝統的アプローチである。
- Byrne et al. (1989 Psych.Bull.), Meredith(1993 Psychometrika) により、full MIとpartial MIの区別が導入された。
- レビュー: Vandenberg & Lance (2000 ORM), Davidov et al.(2014 Ann.Rev.Sociol.), Millsap(2011 書籍)
- 入門者むけおすすめ: Meredith(1993), Millsap(2011 書籍) [←故Millsap先生のこのご著書、初心者向けとはいいがたいと思うけど...?]
MIの欠如への対処。
- Lommen et al. (2014 Front.Psych.): PTSDについての事例。
- Hox et al. (2015 Front.Psych.): mixed mode調査で弱いMIさえ成立しなかったという事例。
- de Roover et al.(2014 Front.Psych.): cluster-wise ssimultaneous component analysis (SCA)による 不等項目検出。[←読まなきゃ!!]
- Barendse et al.(2014 Front.Psych.): Bayeian restricted latent factor analysis (RFA) による不等項目検出。[←BSEMとはちがうのだろうか?]
- Guenole & Brown (2014 Front.Psych.): categorical item factor analysisで、潜在変数の構造に不等性があるのを無視すると回帰パラメータにどんなバイアスがかかるかをシミュレーション。
近似的MI。
- Muthen & Asparouhov (2012 Psych.Method): BSEMアプローチ。[説明が書いてあるけど略]
- van de Schoot et al.(2014 Front.Psych.): 近似的MIに到達する方法のチュートリアル。
- Cieciuch et al. (2014 Front.Psych.), Zercher at al.(2015 Front.Psych.), Bujacz et al.(2014 Front.Psych.), Chiorri et al.(2014 Front.Psych.): BSEMと伝統的手法の比較。
- Fox & Verhagen (2010 in "Cross-cultural Analysis"): 近似的MIをIRTに拡張。事前分布を使わない。[←面白そう!!]
- Kelcey et al. (2014 Front.Psych.): Fox & Verhagenの拡張。
- Muthen & Asparouhov (2014 Front.Psych.), Asparouhov & Muthen (2014 SEM): alignment法。[SEM誌の論文とはたぶんMplus Web Notes 18のことであろう]
MGCFAよりもっと複雑なモデルにおけるMIのテスト。
- Wang et al.(2014 Front.Psych.): 補助変数が名義変数じゃなくて順序変数・連続変数だったときのMIのテスト。[←順序変数ってのはわかるけど... 連続変数ってどういうことよ。動的回帰みたいな話になるの?!]
- Verdam & Oort (2014 Front.Psych.): クロネッカー制約付きのSEMモデルにおけるMIのテスト。時系列潜在変数モデルの代替案となる。[←全然わからん... 読んでみなければ]
- Adolf et al.(2014 Front.Psych.): miltiple-occasion and multiple-subject time series において、時点間MI, 個人間MI, 時点x個人間MIをテストする。[←やばい... これ滅茶苦茶面白そう...]
- Boom (2014 Front.Psych.): 認知発達の分析にMIが重要な役割亜を果たすという事例。
- Jak (2014 Front.Psych.): 3レベル階層モデルでMIをテストする。
- Geiser et al.(2014 Front.Psych.): MMTMモデルの拡張。
- Kroonenberg (2014 Front.Psych.): two-way rating デザインにおけるMIのテスト。
。。。特に国際調査の場合がそうなんだけど、MIが失われる主要な原因のひとつはresponse styleのちがいなので、そっちに言及がないのがちょっと残念。まあ考えてみると、MIの文脈では、DIFとかがある特定の項目を削ったりなんだりしてMIに到達するのが目的になるのに対して、response styleの文脈では項目共通のscale usage heterogeneityを仮定してそれを修正するのが目的になるので、研究が重ならない、というのはわかる。実務場面では、項目セットにおけるDIFとresponse styleはたいてい手を取り合って襲いかかってくるんだけど。
論文:データ解析(2015-) - 読了: van de Schoot, et al. (2015) 測定不変性の最前線
2016年5月 7日 (土)
Bowling, N.A., Huang, J.L., Bragg, C.B., Khazon, S., Liu, M., & Blackmore, C.E. (2016) Who cares and who is careless? Insufficient Effort Respoinding as a reflection of respondent personality. Journal of Personality and Social Psychology.
調査にいいかげんに回答する傾向(IER)とパーソナリティとの関係についての研究。
すぐには役に立ちそうにない話だし(調査対象者をパーソナリティでスクリーニングするわけにもいかない)、ちょっとお気楽すぎるテーマだし(心理学専攻の卒論とかでいかにもありそう)、普段なら食指が動かないのだが、掲載誌がJPSPってところにひっかかった。ま、仕事に役立つかも知れない、ってことで...
個々の調査参加者のIERの測り方については、この論文にはあまり説明がなくて、先行研究をみないといけない模様。項目間で回答の矛盾があるとか、「ありえねー」回答とか、そういうのを使っているみたいだ。
以下、内容メモ:
調査にいいかげんに回答する傾向(insufficient effort responding, IER)の先行研究:
- Huang, Boling, Liu, & Li (2015 J.Business & Psych.): IERを方法論レベルの剰余変数とみている研究; IERの一貫性を検討
- Maniaci & Rogge (2014 J.Res.Personality) : IERへの参加モチベーションの影響を強調; IERとパーソナリティの関連性; IERの一貫性を検討; IERの測定・予防手法
- Huang, Curran, Keeney, Poposki, & DeShon (2012 J. Business & Psych.): 近年の主要研究; IERへの参加モチベーションの影響を強調; IERの測定・予防手法
- Meade & Craig (2012 Psych.Methods): 近年の主要研究; IERへの参加モチベーションの影響を強調; IERの測定・予防手法
- Johnson (2005 J.Res.Personality): 近年の主要研究; IERを方法論レベルの剰余変数とみている研究; ; IERの測定・予防手法
- Kurtz & Parrish (2001 J.Personality Assessment): IERを方法論レベルの剰余変数とみている研究
- Goldberg & Kilkowski (1985 JPSP): IERとパーソナリティの関連性
- Johnson (1981 JPSP) : IERとパーソナリティの関連性
本研究では、
- IERを方法論レベルのノイズではなく、実質的な現象として分析する。
- IERへのモチベーションの影響と、パーソナリティ(Five Factor Modelの因子)の影響を調べる。
- 時間・状況を通じたIERの一貫性について調べる。
実験は5つ。
研究1。IERとFFMの関連性、IERの時間的一貫性を調べる。
大学の人事部門と組んで職員を調査。13ヶ月おいて2回実施(T1, T2)。T1とT2の調査項目は同一で、パーソナリティとかいろいろ訊いている。 ほぼ全員がオンラインで回答。匿名回答だが2回の回答をマッチングできる。両方回答してくれた166名(11%)について分析。
IERの指標については、Curran (in press JESP), Desimone, Harms, & Desimone(2015 J.Org.Behav.), Huang et al. (2012) Maniaci & Rogge (2014), Meade & Craig (2012)をみよ。まあとにかく、Overall IER indexというのとその4つの下位指標を出したんだそうな。
結果: 指標のT1の値とT2の値は高く相関。ただし同一調査での指標間相関も高い。
研究2。IERの状況間一貫性を調べる。
被験者は学生。スクリーニング調査でデモグラなどを聴取。24日後、本調査でパーソナリティとか生活満足とかを聴取。調査者も違うしウェブサイトのURLもデザインも違うし報酬も違うから、つまり状況が異なりますよね[←く、苦しい理屈だ...]。両方答えた759名を分析。
スクリーニング調査では5項目でIERを測った[よくわかんないけど項目間での回答の矛盾を調べているみたい。Huang et al. (2015)をみよとのこと]。
本調査では... [めんどくさいので読み飛ばした。まあとにかく、調査回答やら反応時間やらをつかって、Overall IER indexとその下位指標を出したらしい]。
結果:IER指標は調査間で相関。
研究3。別の目的でとったデータを使ってIERの状況間一貫性を調べる。初回調査ののち、6週にわたってオンラインで週次の記録を付けさせる実験であった。被験者は学生229人。
初回調査にはinstructed-response項目が混ぜてあったので(「この項目ではstrongly agreeをチェックしてください」というような項目)、そういうのを使って、Overall IER indexとその下位指標を出した。週次記録は、提出有無と、別の評定者による「努力して回答しているか」評定をIERの指標とする。
結果:IER指標は状況間で相関。
研究4。IERとパーソナリティ(ビッグ・ファイブ)の関連性を調べる。さすがにパーソナリティも同じ質問紙で測るってわけにはいかないので(そこでIERが起きるかもしれない)、知人の報告を使う。仮説は次の通り:
- 統制性(conscientousness)が高い人はIERが低い。
- 協調性(agreeableness)が高い人はIERが低い。利他的だから。
- 開放性(openness)が高い人はIERが低い。科学への貢献に関心を持ったり、自らの学習の手段としての調査参加に関心を持つだろうから。[←それはナイわ...]
被験者は研究3と同じプールの学生。パーソナリティとかいろいろ訊いておいて、そこからOverall IER indexとその下位指標を出した。さらに、メールで知人をひとり紹介してもらい、その知人に質問紙を送って5因子を評定。International Personality Item Poolというサイトから拾った項目、因子あたり10問。データが揃った217人を分析。
結果: 統制性と協調性はIERと負の相関を示したが、開放性は無相関。開放性の測定が難しいせいかもしれないし、他者評定だったからかも知れない[←往生際が悪い...]。なお、感情的安定性も外向性もIERと負の相関を示した。これは今後の課題。
研究5。IERとGPA・講義欠席率との関連性を調べる。これらはパーソナリティの外的基準として広く用いられているから[←いやいやいや... 学生のIERと講義欠席率の相関が高かったとして、その共通の原因がパーソナリティだっていう説明にはかなーり無理があるんじゃないですかね? 普通に考えれば、その2つの背後にあるのは学業への熱意なのではないかしらん]。GPAとは負の相関、講義欠席率とは正の相関が想定される。
被験者は学生、349人を分析。パーソナリティとかいろいろ訊いて、そこからOverall IER indexとその下位指標を出す。GPAと講義欠席率は自己報告。
結果: 仮説を支持。
この研究の含意:
- IERは個人差の結果だよ。もちろん状況要因もあるでしょうけど。
- 自己報告質問紙を使う皆さん、IERに気をつけようね。IERを測って高い人のデータを捨てるとか、どうにかしてIERを予防するといった方法が提案されているけど、前者はパーソナリティの分布を歪めることになるかも。
今後の課題:
- IERを効率よく測る方法。いまのところinfrequency scaleを使うのが良さそうだけど[←いわゆる"ありえねー"項目のことであろう]。
- IERはどのくらいprevalentか。
- IERの絶対的な大きさは変化するか。たとえば疲労効果とか。
- IERはモチベーションとキャパシティの両方の関数なのか。従来の研究はモチベーションを強調してきたけど、認知資源の制約もあるだろう。この問題は自己報告式調査を自己開示とみるか自己提示とみるかという違いと関連している。自己開示という観点からは、回答の正確性はすなわち真実性であり、IERはモチベーションの低さによって生じるということになる。自己提示という観点からは、回答の正確性は妥当な印象を形成したという問題であり、IERは能力の低さによって生じるということになる。[←いまいちよくわからんが、面白い話だ]
- IERに対するパーソナリティの効果と状況要因の効果は交互作用するか? [←そうそう、これがわかったら絶対面白いと思う。クロンバックの適性処遇交互作用が教育に対して与えたのと同じインパクトを調査方法論に対して与えることになる]
- IERは重要な基準変数を予測するか? 健康維持行動とか。
本分析の限界: [略]
。。。要するに絵に描いたような相関研究である。当然ながら、考察もあんまし突っ込んだ話にはならない。こういうのでもJPSPに載るのか。
結局のところ、多様な状況を通じて観察される行動傾向の背後にあるもののことをパーソナリティと呼ぶんだから、どんな行動領域であれ、個人差とパーソナリティとの相関を調べれば、そりゃあなにかは見つかるでしょう?と思う次第である。その相関が、当該の行動を生起させるメカニズムに新しい光を投げかけてくれるんだとか、あるいはパーソナリティそのものに新しい光を投げかけてくれるんだってんなら、それは素晴らしいですけど、ただ単に、やった!相関がありました!っていわれてもなあ...
個人的には、こういう話にはあんまし関心無くて、むしろIERが起きるメカニズムの一端でもわかるとありがたいんですけどね。それを手がかりに調査手法を改善できるかもしれないから。
あれじゃないかしらん。こうやってビッグファイブとの関連なんか調べてないで(ごめんなさい)、なんかプライミング手続きで認知を方向づけて、その結果IERが変わることを示したほうが、全然面白いんじゃないかしらん。たとえば、恐怖管理理論に基づき予測した通り、死のイメージを想起させると誠実さという伝統的価値観が顕在化し、社会調査に対するいいかげんな回答は減りましたとか。しかしそれはマジメそうな社会調査の場合であって、マーケティング・リサーチとかなんのためにやってんだかわかんない心理学の調査とかに対しては、逆にいいかげんな回答が増えちゃいましたとか。はっはっは。
論文:調査方法論 - 読了:Bowling et al. (2016) 調査にいいかげんに回答する人のパーソナリティ
2016年5月 6日 (金)
Diderrich, G.T. (1985) The Kalman filter from the perspective of Goldberger-Theil estimators. American Statistician, 39(3), 193-198.
題名の通り、Goldberger-Theil推定量とカルマン・フィルタとの関係をあきらかにしましょう、というマニアックな論文。先日の原稿準備の途中で疑問に思って、試しに読んでみた奴。
難しくてわからんことは覚悟の上である。たまに理解を超える論文を無理やり読むことによって、人の精神は鍛えられ、深い絶望に耐え抜く力を身につけることができるのだ、と自分に言い聞かせつつ。
内容を一応メモしておくと...
まずは準備から。
$y = X b + e$
の$b$のBLUEな推定量$\hat{b}$について考えよう。BLUEってことはunbiasedかつbest、すなわち$E(b-\hat{b})=0$かつ$cov(\hat{b}-b)$がトレース最小である。$\hat{b}$は下式で与えられる:
$\hat{b} = P X' W^{-1} y$
ここで$W$は$e$の共分散。$P$は推定誤差の共分散行列$cov(\hat{b}-b)$であり、具体的には
$P = (X' W^{-1} X)^{-1}$
である。
これをGauss-Markov-Aitken定理という[←へえええ?知らなかった。ガウス-マルコフ定理という言い方は聞いたことがあったけど]。最小二乗法の入門書では、この定理は
$(y-Xb)^{-1} W^{-1} (y-Xb)$
を最小化する問題として紹介されている。確率的・分布的な仮定がないところにご注目。
こんどは、いわゆる逆行列の補助定理(matrix inversion lemma)について。以下、行列は必要なときに逆行列を持つものとする。
$P_1^{-1} = P_0^{-1} + X' W^{-1} X$
が成り立つのは、以下のすべてが成り立つとき、そのときに限る:
$P_1 = (I-KX) P_0$
$P_1 P_0^{-1} = (I-KX)$
$K = P_0 X' [W + X P_0 X']^{-1}$
$P_1 X' W^{-1} = K$
[証明略。文系の私としては、わざわざ変な記号を使っておまえは何を言っているんだという感じだが、あとで意味がわかると信じて先に進もう]
では、いよいよ本題です。
$\hat{b}_0 = b + e_0$
を$b$の事前推定値とする。$e_0$の分散を$P_0$とする。当面$b$は定数とする。
これを上の
$y = X b + e$
とどう結合するか。ひとつの路線は、以下の式を最小化するという路線である:
$(b-\hat{b}_0)' P_0^{-1} (b-\hat{b}_0) + (y-Xb)^{-1} W^{-1} (y-Xb)$
もうひとつの路線はこうだ。ベクトル$y$と$\hat{b}$を縦積みし$y_1$とする。行列$X$と$I$を縦積みし$X_1$とする。ベクトル$e$と$e_0$を縦積みし$e_1$とする。すると上の2本の式は
$y_1 = X_1 b + e_1$
これにGauss-Markov-Aitken定理を適用し、BLUEな推定量
$\hat{b_1} = P_1 X_1' W_1^{-1} y_1$
を得る。これをばらしていくと、
$\hat{b_1} = P_1 X' W^{-1} y + P_1 P_0^{-1} \hat{b}_0$
となる。これをGoldberger-Theil推定量という。
さて、この式に逆行列の補助定理を適用すると[...中略。なるほど、このときのために変な記号を使っていたのね...]
$\hat{b}_1 = \hat{b}_0 + K (y - X \hat{b}_0) $
が得られる。なんと、古い推定量にイノベーション$y - X \hat{b}_0$を足しているぞ。これはカルマン・フィルタではないか。
$b$が確率変数であっても、$e_0$, $e$と独立であればこの関係が成り立つ[説明を大幅に略]。
さらにだ。事前推定値$\hat{b}_0$を0とし、$P_0=I(1/k)$, $W=I$とすると、
$\hat{b} = [kI + X'X]^{-1} y$
となる。なんと、これはリッジ推定量ではないか。このようにリッジ推定量とは、事前情報$\hat{b}$は使わないが$P_0$は使う、「半」カルマン・フィルタなのである。
[最後に、この結果を使って一般化カルマンフィルタを導出しよう...という話。力尽きたのでパス]
というわけで、カルマン・フィルタ理論と線形最小二乗理論のつながりがあきらかになった。
60年代初頭、工学ではカルマン・フィルタが登場し、統計学ではGoldberger-Theil推定量が登場した。多くの人々が同じときに違う場所で同じことを考えていたわけだ。
。。。やれやれ。最後の一般化カルマンフィルタの話がよくわかんなかったけど、いいのよ! 文系だから! 次にいこう次に。
論文:データ解析(2015-) - 読了:Diderrich (1985) Goldberger-Theil推定量からみたカルマン・フィルタ