elsur.jpn.org >

« 2016年4月 | メイン | 2016年6月 »

2016年5月30日 (月)

原稿準備のためにとったメモ:

Houtokoop-Steenstra, H. (2000) Interaction and the Standardized Survey Interview: The Living Questionnaire. Cambridge University Press. Chapter 9. Implications for survey methodology.

1. イントロダクション[略]

2. 診断の道具としての会話分析
 調査回答場面の録音をつかった行動コーディング研究は、たくさんのインタビューを分析できる反面、現象の原因についてはわからない。いっぽうCA(会話分析)は少数事例の分析であっても、気づかれていない問題を明らかにする。
 たとえば質問の曖昧性。先行研究を参照するのも大事だが[Belsonという人の本が挙げられている]、対象者のclarification requestが曖昧性を教えてくれる。Schober & Conrad (1997 POQ)をみよ。
 また質問直後の沈黙時間とか、インタビュアーのclarification待ち行動とか、語尾を上げた聞き返しとか、インタビュアーの質問反復とかも役に立つ。選択肢にない反応とかも。インタビュアーの逸脱や回答候補呈示とかも。集計表ばっかりみてないで、逸脱事例に注目しましょう。

3. 構造的問題の検出
 closed questionで、インタビュアーが選択肢を全部読み上げる前に対象者が回答しちゃう事例は危険のサインである。ターンテイキングの構造を変えないといけない。

4. 質問定式化についての新しい問いの生成
 CAで問題をみつけ、実験や認知インタビューで詳しく調べる、ということもできる。
 
5. 柔軟な標準化インタビューの探求
 標準化の探求は、すくなくともその目的が調査データの信頼性だけでなく妥当性にもあるとするならば、もはや維持できない。

5.1 調査方法論と導管メタファ
 伝統的な刺激-反応モデルは、(1)意図された意味と質問の目的が言語的意味とcoincideすると想定し、(2)対象者が調査者の意味したとおりに設問を解釈すると想定する。これらの想定はM. Reddyいうところの導管メタファに由来している[この本のなかでReddyはここが初出。conduit metaphorってそんなに有名なの?] 導管メタファの最大の問題点は、意図された意味と解釈との関係である。対象者は調査者の意図とは異なるやりかたで質問の意味や目的を解釈する。
 対象者に同じ質問文を提示することではなく、同じ「意図された意味」を提示することを目指すべきだ。それが抽出できない対象者に対しては、インタビュアーは調査者のスポークスマンとしてふるまうようにトレーニングすべきだ。

5.2 インタビュアーが質問と回答について議論するのを許容せよ
 インタビュアーはスポークスマンなんだから、質問の意味と対象者の回答について議論してもよいことにしよう。[ここでSchober & Conrad の実験の紹介]

5.3 インタビュアーにフォーマット化されていない回答を受容させよ
 [節タイトルのとおりの内容]

5.4 インタビュアーが推論を引きだし検証するのを許容せよ
 インタビュアーが推論を許されていないということが対象者にはなかなかわからない。推論を許し、検証させよう。たとえば「私の夫が...」というセリフが出てきた後では、対象者は既婚だと推測してよいことにし、未既婚の質問では既婚であることを確認することにしよう。

5.5 対象者にルールを説明せよ
 最初にインタビュー特有のルールを対象者に教示するという手もある。ただし、(1)いやになっちゃって回収率が落ちるかも。(2)従ってくれないかも。

5.6 標準化されたインタビュー・ルールはインタビュアーに問題を突きつける
 インタビューの標準化されたルールに本当に従っていると、インタビュアーは無礼なアホにならざるを得ない。インタビュアーがルールを守らないのはもっともだ。

6. 柔軟なインタビューのコスト
 柔軟なインタビューの欠点: (1)インタビュアーの行動の評価が困難になる。データの妥当性向上がそれに見合うのならばそれで良し。見合わない場合は、インタビュアーの評価なんてどうでもいいんじゃないかということになるかもしれない。(2)インタビュアーのトレーニングが大変になる。(3)柔軟なインタビューには時間がかかる。これらも、データの妥当性向上がそれに見合うかどうか次第である。

論文:調査方法論 - 読了:Houtkoop-Steenstra(2000) 生きている調査票 9章 調査方法論に対する含意

原稿の都合で読んだ論文を記録しておく。

Kiousis, S. (2002) Interactivity: a concept explication. New Media and Society, 4(3), 355-383.
 相互作用性という概念についてのレビュー論文。掲載誌についてはよくわからないが(Webcatでは所蔵館数5)、google様的には引用元537件、この分野にしちゃ多いと思う。
 長い論文で、特に後半はちゃんと読めてないけど、時間が無い。コミュニケーション研究における相互作用概念の先行研究レビューのみメモ。相互作用性についての定義を片っ端から集め、強調するのは(1)技術か、(2)コミュニケーションセッティングか、(3).知覚者か、に注目する。

論文:調査方法論 - 読了:Kiousis (2002) 相互作用性とは何か

2016年5月29日 (日)

雑誌記事の準備のために目を通したんだけど、この章はちょっと事情があってメモをとった(通読するにはあまりに眠かった、というのもひとつの事情)。こういう場合については普段記録してないんだけど、せっかくメモもとったので。

Tourangeau, R., Conrad, F.G., Couper, M.P. (2013) The Science of Web Surveys. Oxford Universicy Press. Chapter 6. Interactive Features and Measument Error.
 Webでは多様で豊かなサーベイ・モードが可能になる。本章では相互作用的ケイパビリティの可能性について検討する。
 Web調査に相互作用的特徴を導入する理由:

  1. 技術的にできちゃうから
  2. いつのまにか相互作用的になっちゃうから。VASをスライダーにした場合とか。
  3. オンライン調査でしかできないことがあるから[←先生、それは理由になってないような気が...]。インタビュアーのアニメーションを最初に選ばせるとか。
  4. 他のモードでみられる現象を確認するため。インタビュアーの性別による影響の検討とか。

相互作用的特徴の導入によって、測定誤差の減少などのなんらかの結果が期待されることもある。でもうまくいかないこともある。

1. 相互作用性の諸次元
 ここで「相互作用性」とは、dynamicであること、responsiveであることを含む。また、human-likeな相互作用とmachine-likeな相互作用を区別する必要がある。調査三回経験を変えるのは前者である[←云いたいことはわかるけど、ここはちゃんとフォーマルに定義してくれないと困るなあ...]
 というわけでdynamic-responsiveとmachine-like - human-likeの2次元を考えよう。ある相互作用的特徴の導入がもたらす結果はこの空間上の位置で決まる。たとえば回答者のパフォーマンスの向上に効果的なのはresponseveでhuman-likeな特徴だ。

2. responsiveでmachine-likeな相互作用的特徴
[以下、個別の要素についての実証研究のレビュー。メモは省略]

3. human-likeな相互作用的特徴

4. まとめ
 どうやらWeb調査の対象者は努力を最小化しようとする傾向が強いらしい。電話調査ならわからん言葉を聞き返してくるのに、Webでマウスオーバーで言葉の定義がポップアップするようにしてもあんまし使ってくれない。相互作用的特徴を使ってもらうというのがひとつの課題。
 相互作用的特徴は回答品質を向上させたりそうでもなかったりする。ショートカット的行動を防止する奴はうまくいくらしいが、繰り返しても大丈夫かどうかは今後の課題。
 調査モードの効果を最小限にする調査票を作りたい場合と、とにかくそのモードでベスト・プラクティスを目指す場合とでも話が違う。

 。。。なんだかつまらんなあ...と思いながら読み進め(すいません)、途中で気づいたけど、著者らが調査における相互作用性を整理する枠組みとして考えているresponsivenessとhumannessとは、コミュニケーション研究者Kiousisいうところの「相互作用的技術」と「相互作用的知覚」だ。簡単にいっちゃうと、相互作用そのものの様態には注目せず、入力と出力に注目しているわけである。これは私にとってはちょっとした発見であった。なんというか、あのTourangeauさんにして、古き良き認知心理学というか、情報処理アプローチの子供なのだなあ、と... 孤立した個人の入力-情報処理-出力に注目し、相互作用から生じるダイナミクスはなるべく話に持ち込まない、というあたりが...
 調査の心理学にはもう一つの流れ、社会学・言語学の会話研究からのアプローチとか、認知心理学だとルーシー・サッチマンの標準化設問批判とか、 そういうオルタナティブがあると思う。Kiousisのいう「相互作用的セッティング」に相当する流れだ。2つの流れはそんなに簡単に融合できるもんじゃない、ってことなのだろう。

論文:調査方法論 - 読了:Tourangeau, Conrad, & Couper (2013) Web調査の科学 6章: 相互作用的特徴

2016年5月28日 (土)

Hatzinger, R., Dittrich, R. (2012) prefmod: An R package for modeling preferences based on paired comparisons, ranking, or rating. Journal of Statistical Software, 48(10).
 Rのprefmodパッケージの解説。要は一対比較データを分析するパッケージである。実戦投入前の儀式として読みはじめたのだが、途中で今回は使わないことにしたので、急にやる気が落ちて、適当に済ませてしまった。

 どういう話かというと...
 いま、$J$個の対象に対する一対比較データがある。以下、モデルとして次の2つを考える。

 その1, Bradley-Terryモデル。ペアの勝敗をモデル化する。対象$j$の価値を0以上の値$\pi_j$で表して
 $p(j \succ k | \pi_j, \pi_k) = \frac{\pi_j}{\pi_j + \pi_k}$
これを以下のように書き換えることができるのだそうだ[よくわからないけど、素直に信じることにします]。$j$が$k$に勝ったら+1, 負けたら-1をとる$y_{jk}$を考えて
 $p(y_{jk}) = c_{jk} \left( \frac{\sqrt{\pi_j}}{\sqrt{\pi_k}} \right)^{y_{jk}}$
ここで$c_{jk}$は定数。
 これを対数線形モデルとして定式化してみよう(LLBTモデル)。$j$と$k$を比べた人数を$n_{jk}$として、$y_{jk}$がある値をとる期待度数
 $m(y_{jk}) = n_{jk} p(y_{jk})$
について、こうモデル化する:
 $\eta_{y_{jk}} = \log m(y_{jk}) = \mu_{jk} + y_{jk}(\lambda_j - \lambda_k)$
なお、$\log \pi = 2 \lambda$となる。

 その2, パターン・アプローチ。ペアのセットの勝敗の同時確率をモデル化する。
 ベクトル$\mathbf{y} = (y_{12}, y_{13}, \ldots, y_{J-1,J})$について、
 $p(\mathbf{y}) = c \prod_{j <k} \left( \frac{\sqrt{\pi_j}}{\sqrt{\pi_k}} \right)^{y_{jk}}$
 これも対数線形モデルとして定式化してみよう。期待度数のベクトル
 $m(\mathbf{y}) = n p(\mathbf{y})$
について、独立性を仮定すれば:
 $\eta_{\mathbf{y}} = \log m(\mathbf{y}) = \mu + \sum_{j=1}^J \lambda_j x_j$
 $x_j$と$\mathbf{y}$との関係について説明があるけど、省略...
 独立性を仮定せず、交互作用項を入れる定式化も説明してあるけど、省略...

 ... だんだんめんどくさくなってきたのですっとばすけど、一対比較にタイがある場合にも拡張できる。対象者の群別にパラメータを変えることもできる。$\lambda$の説明変数として人の共変量を投入することもできる。対象の共変量を投入することもできる。ランキングにも拡張できる。Likert型のレーティングにも拡張できる(タイがいっぱいあるランキングだと思えばいいわけだ)。欠損値も扱えるように拡張できる。対象者の潜在クラスを導入できる。

 後半はパッケージの紹介と実例。眠くて途中船をこいだりしながらめくった。ま、ほんとに必要になったら読み直せばいいさ。
 Bradley-TerryモデルのパッケージはほかにBradleyTerry2, eba, psychotreeというのがあるんだけど、独立性のない奴を扱えるのが(よってレーティング型データなどを扱えるのが)このパッケージの特徴である由。ふうん。

 考えてみりゃ、MaxdiffだってBradley-Terryモデルで解けるはずだよな。効用に潜在クラスを入れられるんなら、このパッケージでやってもいいかも。

論文:データ解析(2015-) - 読了:Hatzinger & Dittrich (2012) Rのprefmodパッケージで一対比較データを分析しよう

2016年5月23日 (月)

ちょっとスマホを眺めすぎだと反省し、移動中はせいぜい本を、それもできればフィクションを、読むように心がけているのだけれど、なかなか読めないものだ。

Bookcover 赤く微笑む春 (ハヤカワ・ポケット・ミステリ) [a]
ヨハン・テオリン,Johan Theorin / 早川書房 / 2013-04-10
スウェーデンの島を舞台にした四部作の三冊目。暗くて重たい小説なのだが、あと一冊でお別れかと思うと、ちょっと寂しい。なんというか、日本人好みなところがあるような気がするなあ。訳者の方は「無常の感覚」と表現していたが、当たっているかも。

Bookcover 靴の話/眼 小島信夫家族小説集 (講談社文芸文庫) [a]
小島 信夫 / 講談社 / 2015-01-10

Bookcover ピランデッロ短編集 カオス・シチリア物語 (エクス・リブリス・クラシックス) [a]
ルイジ ピランデッロ / 白水社 / 2012-07-21

Bookcover 図書準備室 (新潮文庫) [a]
田中 慎弥 / 新潮社 / 2012-04-27

フィクション - 読了:「カオス・シチリア物語」「靴の話・眼」「赤く微笑む春」「図書準備室」

Bookcover ブッダが説いたこと (岩波文庫) [a]
ワールポラ・ラーフラ / 岩波書店 / 2016-02-17

Bookcover 仏教誕生 (講談社学術文庫) [a]
宮元 啓一 / 講談社 / 2012-03-13

Bookcover 浄土思想論 [a]
末木文美士 / 春秋社 / 2013-07-22

Bookcover 日本仏教史 [a]
蓑輪 顕量 / 春秋社 / 2015-06-22

哲学・思想(2011-) - 読了:「ブッダが説いたこと」「浄土思想論」「日本仏教史」「仏教誕生」

Bookcover 大人の樹木学 (新書y) [a]
石井 誠治 / 洋泉社 / 2013-10-05
著者いわく、木の名前に詳しくなる方法のひとつは、庭先で植木を世話している住人を見かけ次第、気軽に声をかけ会話すること、だそうだ。いやー、そんな対人スキルがあったらさ... もっと違う人生送っているよ...

Bookcover 丹下健三――戦後日本の構想者 (岩波新書) [a]
豊川 斎赫 / 岩波書店 / 2016-04-21

Bookcover 溺れるものと救われるもの (朝日選書) [a]
プリーモ・レーヴィ / 朝日新聞出版 / 2014-06-10

Bookcover 「憲法改正」の真実 (集英社新書) [a]
樋口 陽一,小林 節 / 集英社 / 2016-03-17

Bookcover 日本会議の研究 (扶桑社新書) [a]
菅野 完 / 扶桑社 / 2016-04-30

Bookcover 成熟と喪失 “母”の崩壊 (講談社文芸文庫) [a]
江藤 淳 / 講談社 / 1993-10-04

Bookcover 村上ラヂオ3: サラダ好きのライオン (新潮文庫) [a]
春樹, 村上 / 新潮社 / 2016-04-28
途中で気が付いたんだけど、この本、すでに単行本で読んでいた...

ノンフィクション(2011-) - 読了:「成熟と喪失」「丹下健三」「溺れるものと救われるもの」「『憲法改正』の真実」「日本会議の研究」「村上ラヂオ3」「大人の樹木学」

Bookcover 痴女の誕生 アダルトメディアは女性をどう描いてきたのか [a]
安田 理央 / 太田出版 / 2016-03-30
興味深い本であった。「痴女」「熟女」といった概念がどうやって形成されてきたか、という考察にとても力がはいっているし、また面白い部分でもあったのだが、身体に装着した架空の男性器(張り子)を愛撫された女性が興奮するのをみてAV監督が新シリーズを決断する、というくだりにも不思議な面白さがある。心理学でやるゴムの手の実験を思い切り複雑にしたような話だ。

Bookcover 天正遣欧使節 [a]
松田 毅一 / 朝文社 / 1991-11
単行本を古本屋で入手したが、どうやら講談社学術文庫にはいっている模様。
 著者の松田毅一さんは70年代に天正少年使節についての子供向けの本を何冊か書き(私が読んで感動したのもその一冊だったのであろう。「ふたつの使節」という本だった)、そのなかの「天正の少年使節」という本が読書感想文の課題図書に選ばれ二十万部も売れた由。実はそれらはヨーロッパ旅行の資金を貯めるために大急ぎで書いた本で、おかげですごく助かったのだそうだ。よかったですね。

Bookcover 自死: 現場から見える日本の風景 [a]
瀬川正仁 / 晶文社 / 2016-05-10
こどもの自殺、過労死、精神医療における薬害の問題など、それぞれに大きなテーマを一冊に詰め込んでしまって、なんだかピントがぼけちゃったような感じ...

Bookcover 公明党 - 創価学会と50年の軌跡 (中公新書) [a]
薬師寺 克行 / 中央公論新社 / 2016-04-19

Bookcover マルクス思想の核心 21世紀の社会理論のために (NHKブックス) [a]
鈴木 直 / NHK出版 / 2016-01-22

Bookcover 闇経済の怪物たち グレービジネスでボロ儲けする人々 (光文社新書) [a]
溝口 敦 / 光文社 / 2016-04-19

ノンフィクション(2011-) - 読了:「闇経済の怪物たち」「マルクス思想の核心」「天正遣欧使節」「痴女の誕生」「公明党」「自死: 現場から見える日本の風景」

Bookcover 階級都市―格差が街を侵食する (ちくま新書) [a]
橋本 健二 / 筑摩書房 / 2011-12-01
興味深い本であった。いくつかメモ:

もっとも、著者の先生には申し訳ないけど、後半の東京フィールドワークで関心を失い、パラパラと流し読みで済ませてしまった。なんというか、東京歴史散歩というような話には全く関心が持てないのである。いずこもいったん全部取り壊して更地にし、同じ規格の集合住宅で埋め尽くしちゃえばいいのに、と思うことさえある。東京に対する反発かもしれないし、もともと地元といえるような場所を持ち合わせていないせいかもしれない。

Bookcover 人はなぜ宗教を必要とするのか (ちくま新書) [a]
阿満 利麿 / 筑摩書房 / 1999-11
現代人は無宗教じゃもう保たないじゃないかという問題意識を前提に、じゃあどうしたらいいのか考えようという本。具体的には、もちろん仏教の話。

Bookcover テロルと映画 - スペクタクルとしての暴力 (中公新書) [a]
四方田 犬彦 / 中央公論新社 / 2015-06-25

Bookcover 鎌倉幕府と朝廷〈シリーズ日本中世史 2〉 (岩波新書) [a]
近藤 成一 / 岩波書店 / 2016-03-19

Bookcover ガルブレイス――アメリカ資本主義との格闘 (岩波新書) [a]
伊東 光晴 / 岩波書店 / 2016-03-19
経済学の本を読んでいるととたんに眠くなる。5分で爆睡できる。でもなぜかわからないが、制度学派ってんだろうか、ヴェブレンとかガルブレイスとか、(ちょっと違うのかもしれないけど)取引コストとか、そういうのだけはすごく面白く感じる。個人的性向の問題なのだけど、いったいなぜこうなっちゃったんだろうか、よくわからない。

Bookcover 寛容論 (中公文庫) [a]
ヴォルテール / 中央公論新社 / 2011-01-22

ノンフィクション(2011-) - 読了:「階級都市」「人はなぜ宗教を必要とするのか」「テロルと映画」「鎌倉幕府」「ガルブレイス」「寛容論」

Bookcover Gのサムライ (torch comics) [a]
田中圭一 / リイド社 / 2016-04-15
web連載時に欠かさず読んでいたんだけど、あまりのバカバカしさに単行本で買ってしまった。
 奥付をよく見ると、これ、もとはリイド社の劇画誌(コミック乱ツインズ)に連載していたギャグマンガで、webには再録だった模様。すごくエッジの効いたネット向きのマンガだと感心していたんだけど、最初から意図していたのかなあ。

Bookcover さらば、佳き日 (2) (it COMICS) [a]
茜田千 / KADOKAWA/アスキー・メディアワークス / 2016-03-12
めっちゃイケメンの兄とめっちゃ可愛らしい妹の禁断の恋を抒情的に描く。死ねって思いながら読んだ。

Bookcover ふしぎの国のバード 2巻 (ビームコミックス) [a]
佐々 大河 / KADOKAWA/エンターブレイン / 2016-05-14
なぜイザベラ・バードの日本旅行記をマンガにしようなどと思い立ったのだろう? 特大ホームラン「テルマエ・ロマエ」もそうだけど、エンターブレインってすごいなあ。

Bookcover 死者の書(上) (ビームコミックス) [a]
近藤 ようこ / KADOKAWA/エンターブレイン / 2015-08-24
Bookcover 死者の書(下) (ビームコミックス) [a]
近藤 ようこ / KADOKAWA / 2016-04-25
あ、これもエンターブレインだ。折口信夫「死者の書」のマンガ化。10年くらい前に折口の本を読んだときは、その言語感覚には惹かれたかれど、話の筋はどうもピンと来なかった。こういう話だったのか。独立した作品としてももちろんすばらしいんだけど、著者が謙虚に仰っているように、「鑑賞の手引き」としても面白いと思う。

Bookcover 団地ともお (27) (ビッグコミックス) [a]
小田 扉 / 小学館 / 2016-03-30

Bookcover アイアムアヒーロー(20) (ビッグコミックス) [a]
花沢健吾 / 小学館 / 2016-04-12

Bookcover 東京タラレバ娘(5) (KC KISS) [a]
東村 アキコ / 講談社 / 2016-05-13
好き嫌いはあろうかと思うが、多くの人の心をどこかで揺さぶるマンガだと思う。共感できるかどうかは別にして、なにか人間の本質的な哀しさ、可笑しさのようなものを描いているように思う。

コミックス(2015-) - 読了:「東京タラレバ娘」「Gのサムライ」「団地ともお」「アイアムアヒーロー」「さらば、佳き日」

Bookcover たそがれたかこ(7) (KCデラックス) [a]
入江 喜和 / 講談社 / 2016-04-13
いま一番気になる連載。読むたびに胸が詰まります...

Bookcover いぬやしき(6) (イブニングKC) [a]
奥 浩哉 / 講談社 / 2016-04-22

Bookcover 辺獄のシュヴェスタ (3) (ビッグコミックス) [a]
竹良 実 / 小学館 / 2016-04-12

Bookcover 独身OLのすべて(4) (KCデラックス) [a]
まずりん / 講談社 / 2016-04-22

Bookcover それでも町は廻っている 15巻 (ヤングキングコミックス) [a]
石黒 正数 / 少年画報社 / 2016-04-30

Bookcover 僕だけがいない街(8) (角川コミックス・エース) [a]
三部 けい / KADOKAWA / 2016-04-27

コミックス(2015-) - 読了:「たそがれたかこ」「いぬやしき」「辺獄のシュヴェスタ」「独身OLのすべて」「それでも町は廻っている」「僕だけがいない街」

朝までに終わるはずの仕事がどうしても終わらないので、せめて読了本の記録くらいはつけておくことにする... まずはコミックスから。

Bookcover 惑わない星(1) (モーニング KC) [a]
石川 雅之 / 講談社 / 2016-03-23
考えてみればこの人の出世作の設定も途方もないものだったが(菌が喋る)、本作の設定も大変不思議だ(惑星が喋る)。まだ一巻だけど、ついていくのが難しい...

Bookcover 大奥 13 (ジェッツコミックス) [a]
よしながふみ / 白泉社 / 2016-04-28

Bookcover リバースエッジ 大川端探偵社 7 [a]
ひじかた憂峰,たなか亜希夫 / 日本文芸社 / 2016-05-09

Bookcover 中間管理録トネガワ(2) (ヤンマガKCスペシャル) [a]
福本 伸行,橋本 智広,三好 智樹 / 講談社 / 2016-04-06

Bookcover 聖船のラー (1) (ゲッサン少年サンデーコミックス) [a]
繭住 翔太 / 小学館 / 2016-03-18

Bookcover パパと親父のウチご飯 2巻: バンチコミックス [a]
豊田悠 / 新潮社 / 2015-06-09
Bookcover パパと親父のウチご飯 3巻: バンチコミックス [a]
豊田悠 / 新潮社 / 2015-11-09
このマンガの設定がいまいちピンとこなかったけど、ようやくわかってきた。事情があって子連れの男二人が同居してるんだけど、いっぽうは優男、他方はこわもて、っていう設定だったんだ! 絵柄では両方ともすっきりしたイケメンなので気がつかなかったよ! どうせなら、ほんとに鬼瓦みたいな顔にすればいいのに。

コミックス(2015-) - 読了:「大奥」「惑わない星」「リバーズエッジ 大川端探偵社」「中間管理職トネガワ」「聖船のラー」「パパと親父のウチご飯」

 そういえば、ずっと前にこんなメモを作ったんだった...

 別に自分がどんな映画が好きなのか宣伝したいわけじゃないんだけど、昨年日本公開されたテディ・チャン監督の 「カンフー・ジャングル」はとても気に入った。なんというか、去りゆく香港カンフー映画の時代への暖かい挨拶というか、ちょっと郷愁に駆られるような、よい映画です。

 この映画、 エンド・クレジットの直前に"The producers wish to dedicate this film to..."という前置きで、カメオ出演した大物や本作スタッフなど、 たくさんの香港映画人が次々に紹介される。しかしながら、残念なことにほとんどの人物が誰だかわからないわけで、劇場で観ている際は、ちょっと取り残されたような気持ちであった。
 あ、youtubeにあがっていた..せっかく調べたのに... (涙)

 先日DVDを買っちゃって、横目で繰り返し見ながらPCに向かい、誰が誰だか逐一調べてしまった。メモまでつくったので載せておく。
 いえ、私も別にそんなにヒマなわけじゃないんですけどね。(説得力なし)

 主なデータソースはIMDBです。きっと誤りもあるかと思いますです。

雑記 - 映画「カンフー・ジャングル」に登場する香港映画人たち

2016年5月22日 (日)

先週都合により目を通した論文のメモをのせておく。ほんとはそれどころじゃないんだけど...

Rossi, P., Gilura, Z., Allenby, G.M. (2001) Overcoming Scale Usage Heterogeneity: A Bayesian Hierarchical Approach. Journal of the American Statistical Association, 96(453), 20-31.
 調査票に5件法の項目をずらっと並べたところ、回答をみると妙に右側にばかりマルしている人もいれば妙に左側にばかりマルしている人もおり、これはいかなる前世の因縁かとくよくよ思い悩む世界1000万人のリサーチャーを憐れみ、ベイジアン・モデリングのビッグ・スターAllenby兄貴とその仲間たちが授ける必殺の階層ベイズモデル。(必殺でもないかも。憐れんでもいないかも。1000万人もいないかも)
 仕事の都合で急遽目を通した。兄貴の主著"Bayesian Statistics and Marketing"(以下BSM本)のCase Study 3とほぼ同じ内容だと思うのだが、同じのを二度読むのもなんだか癪にさわったし、本を持ち歩くのは重かったので。

 前置きは省略して、いきなりモデルにはいると。。。

 対象者 $i$ ($N$人) の項目 $j$ ($M$個) への回答の背後に連続的潜在変数$y_{ij}$を仮定する。全部$K$件法だとして、閾値$c_0, \ldots, c_K$を仮定し、$c_0 = -\infty, c_K=\infty$とする。[ここでは閾値が全員共通だと考えている点に注意]
 ベクトル$y_i = [y_{i1}, y_{i2}, \ldots, y_{iM}]'$について$y_i \sim N(\mu^*_i, \Sigma^*_i)$と仮定する。
 [えーっと... ここまではまだ、潜在変数が回答に落ちる仕組みの話であって、潜在変数の生成についてはなんら語ってないわけね]

 で、$y_i$についてこうモデル化する。
 $y_i = \mu + \tau_i \iota + \sigma_i z_i, \ \ z_i \sim N(0, \Sigma)$
よって$\mu^*_i = \mu + \tau_i \iota, \Sigma^*_i = \sigma^2_i \Sigma$である。で、尺度の左端につけやすい人は$\tau_i$が大きく$\sigma$が小さい人、両極につけやすい人は$\tau_i$がゼロで$\sigma$が大きい人、という風に考える。
 [注目!ここでいう$y_i$は態度のベクトルではなくて、態度と回答スタイルをコミにしたベクトルなのだ。$M$個の回答の背後にある態度ベクトルの分布としてまず多変量正規分布 $N(\mu, \Sigma)$を考え、$i$さんの潜在ベクトルの分布はそれを$\mu$から$\sigma_i$倍して$\tau_i \iota$ずらしたものだ、と考えるわけね]

 あるいはこう考えてもよい。上では閾値を全員共通に$c_1, \ldots, c_K$と捉えたが、$y_i$の分布は全員で共通と考え、閾値の側に個人差があると捉えて
 $c^*_i = \tau_i + \sigma_i c$
これでも結局は同じことになる。[そうやね、こっちのほうがわかりやすいわね]

 モデルに階層をいれます。
 標準的な階層モデルであれば、位置$\tau_i$と尺度は$\sigma_i$はアプリオリに独立で、条件付き共役事前分布に従うと仮定するところだが、ここでは次のように考える。
 $[\tau_i, \log \sigma_i]' \sim N(\varphi, \Lambda)$
$\tau_i$と$\sigma_i$が相関を持ちうることに注意。
 識別の都合上、$\varphi_1 =0 ,\varphi_2 = -\lambda_{22}$と制約します。$E[\tau_i]=0, E[\sigma_i]=1$としているわけです。

 [2018/01/01追記: $\lambda_{22}$とは$\Lambda$の2番目の対角要素であろう。このくだり、この論文を読んだときには疑問に思わなかったのだが、このたび振り返ってみるとよく理解できない。BSM本の該当箇所(p.242)のほうが詳しいし、制約のかけ方が若干変更されているので、訳出しておく]

$\tau_i$を識別するため、制約$E[\tau_i]=0$をかける。$\tau_i$の分布は対称かつユニモーダルなので、この分布の中央値と最頻値もゼロにしたことになる。さて、$\sigma_i$の分布は歪んでいるから、識別制約の選択には十分な注意が必要である。ひとつの論理的な選択は$E[\sigma^2_i]=1$とすることであろう。これは識別制約として$\varphi_2 = -\lambda_{22}$をかけることに対応する。しかし、散らばりのパラメータ($\lambda_{22}$)が大きくなるにつれて、$\sigma_i$の分布は太い右裾を持ちつつ、1より左にある最頻値の周りに集中する。これは事前分布としてあまり望ましいものではない。[...]
 もっと理にかなったアプローチは、$\sigma_i$の事前分布の最頻値を1に制約するというものである。これは識別制約として$\varphi_2 = \lambda_{22}$をかけることに対応する。[...] $\lambda_{22}$が大きくなるにつれて、$\sigma_i$の分布は1のまわりに固まるが、右裾が厚くなって散らばりが大きくなる。というわけで、我々は
 $\varphi_1 = 0, \varphi_2 = \lambda_{22}$
という識別制約を採用する。なお、Rossi et al.(2001)では平均を1にするという方略を採用していた。

[うううむ。云っている意味はわかったけど、$E[\sigma_i]=1$とするためには$\varphi_2 = -\lambda_{22}$とすればよいという理由がやっぱりわからない。記号のせいでどうも混乱してしまうので、頭の悪い俺のために、$\tau_i$と$\sigma_i$を独立とみなし、$\sigma_i, \varphi_2, \lambda_{22}$をそれぞれ$X, A, B$と書き換えよう。すると
 $\log X \sim N(A, B)$
$X$は対数正規分布に従っている。対数正規分布の平均は
 $E[X] = \exp(A+B/2)$
だ。$E[X]=1$とするためには$A + B/2 = 0$、つまり$A = -B/2$とすればよい。もとの記号に戻すと$\varphi_2 = -\lambda_{22}/2$となる。あっれーーー? どこで間違えたんだろう?]

 閾値のほうは、$\sum_k c_k = m_1, \sum_k c^2_k = m_2$と制約します。さらに、$c_k = a + b k + e k^2$という制約も入れ、自由パラメータを$e$だけにします。[細かいところよくわかんないけど、後者の制約はちょっと勘弁してほしい... 前者の制約だけで自由パラメータは$K-2$個になる模様だ、5件法とかならもうそれで十分じゃん]
 
 最後に、事前分布の導入。
 $\pi(\mu, \Sigma, \varphi, \Lambda, e) = \pi(\mu) \pi(\Sigma) \pi(\varphi) \pi(\Lambda) \pi(e)$
として...

 2018/01/01追記: ここからは、この論文のメモから離れ、この論文、BSM本、Rのbayesm::rscaleUsage()のマニュアル、の3つを比較してみる。

BSM本における$\Lambda$の事前分布についての説明。まわりくどくて面倒なので、虚心に丸ごと全訳する。

$\Lambda$の事前分布は、$\tau_i, \sigma_i$の推定値がシュリンクする程度に影響する。我々の階層モデルは、$\tau_i, \sigma_i$の分布についてデータが持っている情報に適応できるが、ただしそれはハイパーパラメータ$\Lambda$の事前分布の支配下での話である。$\tau_i, \sigma_i$の推定値の基盤となる設問は、あまり数が多くないのがふつうだろう。このことは、$\Lambda$の事前分布の影響がきわめて大きくなるであろうということを意味している。階層モデルの多くの適用事例では、十分な量の情報を提供してくれるユニットのサブセットが存在し、このサブセットのおかげで、適応的シュリンケージによって$\Lambda$を決定できる。しかし我々の状況では、こうしたサブセットを利用することができず、$\Lambda$の事前分布が通常よりも大きな影響力を持ちうるのである。以上の理由により、$\Lambda$の事前分布の選択には注意が必要である。また、ここで検討・提案する事前分布のセッティングは、階層モデルの文脈で通常用いられるものよりも幾分タイトなものになる。
 $\Lambda$の事前分布の役割は、$\tau_i, \sigma_i$の事前分布を導出することである。事前分布のハイパーパラメータの選択が持つ含意について検討宇するために、$\tau_i, \sigma_i$の周辺事前分布をシミュレーションで計算してみよう。周辺事前分は下の式で定義される。
 $\pi(\tau, \sigma) = \int p(\tau, \sigma | \Lambda) \pi(\Lambda | \nu_\Lambda, V_\Lambda) d\Lambda$
 $\nu_\Lambda, V_\Lambda$について評価するために、$\tau_i, \sigma_i$がとりうる値については幅広く検討するが、事前分布の分散については許容可能な範囲より大きくならないように制約する。$\tau$については範囲を$\pm 5$とする。これは10件尺度の大部分を包含するという意味で非常に幅の広い範囲である。$\sigma$については、このパラメータによって潜在変数が取り得る値の範囲がどのように制約されるかといを考えないといけない。$\sigma$が小さいということは、回答者が尺度のうち狭い部分しか使わないということを表し、$\sigma$が大きいということは、回答者が尺度の全体を使うということを表す。いま、「小」尺度使用者(たとえば、下の3段階とか、上の3段階とかしか使わないような人)、「中」尺度使用者(10件法で5段階しか使わない人)、「大」尺度使用者(尺度の両端を使う人)がいるとしよう。「中」使用者のSDに対する「小」使用者のSDの比は、$\sigma$の「小さい」値に対応するだろう。また、「中」使用者のSDに対する「大」使用者のSDの比は、$\sigma$の「大きい」値に対応するだろう。このように考えると、$\sigma$の範囲は幅を広く取って(0.5, 2)程度だといえるだろう。そこで次のセッティングを採用する。これは$\tau_i, \sigma_i$についての比較的に情報的な事前分布に対応している。
 $\nu_\Lambda = 20, \ V_\Lambda = (\nu_\Lambda - 2 - 1) \bar{\Lambda}$
$\bar{\Lambda}$は2x2の対角行列で、対角要素は[4, 0.5]とする。
 このセッティングは、$E[\Lambda]$が$\bar{\Lambda}$にほぼ等しいことを保証する。$\tau_i, \sigma_i$の周辺事前分布は、変に大きな値を取ることなく、適切な範囲をカバーする。

 やれやれ... 追記はここまでにして、論文のメモに戻る。

 ....でもって、これをGibbsサンプラーで推定する。[付録に細かいことがいろいろ書いてあるけど、パス]

 実例。顧客満足度調査、n=1811, 10件法6項目。このモデルで推定した真値と支出額との相関が高かった、というような話。

 ... 読みなおしてみて、やっぱり面白い論文であった。Allenby兄貴のチームは、論文は面白いのにね、なんであの本はあんなにわかりにくいんだろうか。
 感想が4点。

 せっかくなので(なにがだ)、Allenby兄貴の「兄貴」称号の由来となった、香港映画最後のカンフー・スター、ドニー・イェン兄貴の名場面から。日本での最新公開作「カンフー・ジャングル」 (2014, 陳徳森監督)の最後の対決シーンより。

 ドニー兄貴の大ヒット作といえば「イップ・マン」シリーズだが、現代劇に限って言えば、本作が兄貴の最高傑作なのではないだろうか。個人的な意見でございますが、回り道をし歳を食い、カンフーこそすごいけれどもちょっとダメなところのある男を演じ始めたとき、ドニーさんは俄然光り輝き始めたように思う。「孫文の義士団」のギャンブル中毒とか。
 この映画でいうと、敵役のワン・バオチャンがいかに非人間的なまでに強いかという描写に力を注いだところも勝因だけれど、主演のドニーさんが妹弟子の写真をひそかにスマホの待ち受け画像(?)にしているというあたりが、なんというかその、ぐっとくるわけであります。

(2018/01/01: 大幅に追記した)

論文:データ解析(2015-) - 読了:Rossi, Gilura, Allenby (2001) k 件法項目で高いほうにばかり答える人や低いほうにばかり答える人がいるのをなんとかする

2016年5月21日 (土)

仕事も副業もうまくいかないことばかり、たまにスマホの画面でSNSを開くと、あの人もこの人もみんな立派で有意義な人生を送っておられるので、あわてて目をそらし、沼の泥を掬うような地味な仕事のことを考えるのであった...

DuMouchel, W.H., Duncan, G.J. (1983) Using sample survey weights in multiple regression analysis of stratified samples. Journal of the American Statistical Association, 78(383), 535-543.
 調査データの分析の際、標本をウェイティングしている場面(いわゆるウェイト・バック集計をしている場面)で、その標本を使って回帰分析するときはどうすんのさ、という論文。仕事の都合で読んだ。またまた、古い論文を...

 シンプルな回帰分析について考えよう。サンプルサイズ$n$、目的変数1個、説明変数$p$個とする。回帰係数の最小二乗推定量は
 $\hat{\beta} = (X' X)^{-1} X' Y$
だ。
 さてここで、標本の抽出確率が均等でなかったらどうするか。ここでは層別抽出に絞って考える(かつ、$Y$による層別ではないとする)。
 ひとつの考え方は、層を無視して上の推定量をしれっと使うというもの。
 もうひとつは、多くの教科書に書いてあるんだけど、WLS推定量を使うというもの。層別変数を$\tilde{J}$、層数$k$、母集団における割合$\{\pi_j\}$は既知とする。水準$j$のサンプルサイズを$n_j$とすると、個体$i$に与えるウェイトはそいつが属する層を$j_i$として
 $w_i \propto \pi_{j_i} / n_{j_i} $
このウェイトを対角にいれた行列を$W$とする。WLS推定量とは
 $\hat{\beta}_W = (X' W X)^{-1} X' W Y$
 さあ、どっちを使うべきか? [カーン ←ゴングの音]

 この議論、少なくともKlein & Morgan(1951)というのにまで遡るのだそうだ。
 「しれっと」派の言い分はこう。WLS推定ってのは誤差分散が等しくない時に使うんであって、この話と関係ないじゃん[←そうそう、俺もそう思った]。誤差分散が等質であるかぎり$\hat{\beta}$は不偏かつ最小分散なのであって、層のサイズがどうなっていようがどうでも関係ない。
 いっぽうWLS派にいわせると、抽出スキームのせいでバイアスが生じているはずだから、$\hat{\beta}$はもはや最適でないはずである。どうにかしなきゃ。
 著者らいわく。これは結局、母集団についてどう考えるかで決まる問題だ。

 4つのモデルを考えよう。

 その1, 等質な線形モデル。
 $\tilde{Y} = \tilde{X} \beta + \tilde{\epsilon}$
$\tilde{\epsilon}$は平均0, 分散$\sigma^2$の偶然誤差で、$(\tilde{X}, \tilde{J})$とは独立。

 その2, 混合モデル。
 $\tilde{Y} = \tilde{X} \beta(j) + \tilde{\epsilon}$
$\tilde{\epsilon}$は平均0, 分散$\sigma^2$の偶然誤差で、$(\tilde{X}, \tilde{J})$とは独立。
 つまり、$\beta$が層によって違うと思っているわけである。分析者が関心を持つのは、$\beta$の重みづけ平均
 $\bar{\beta} = \sum_{j=1}^k \pi_j \beta(j)$
である。

 その3、omitted-predictorモデル。
 実は、$q$個の変数$\tilde{Z}$があって、
 $\tilde{Y} = \tilde{X} \alpha + \tilde{Z} \gamma + \tilde{\epsilon}$
なのだけれど、我々は不幸にして$\tilde{Z}$を持っていない。で、$\tilde{Z}$のうち$\tilde{X}$に直交する部分を取り出して$\tilde{U}$とすると
 $\tilde{Y} = \tilde{X} \beta + \tilde{U} \gamma + \tilde{\epsilon}$
なのである。分析者はほんとは$\alpha$と$\gamma$が知りたいんだけど、あきらめて$\beta$を調べているのだ。

 その4、一般的な非線形モデル。ないし、モデルなし。
 $\tilde{Y} = \tilde{X} \beta^* + \tilde{\epsilon}^*$
 $E[\tilde{\epsilon}^*] =0$
 $cov(\tilde{X}, \tilde{\epsilon}^*) = 0$
としか想定しない。$(\tilde{X}, \tilde{J})$ で条件づけられた$\tilde{\epsilon}^*$の期待値とか分散とかについてはなあんにも考えてない。
 分析者が関心を持っているのは
 $\beta^* = E(\tilde{X}' \tilde{X})^{-1} E(\tilde{X}' \tilde{Y})$
である。これは有限母集団を全数調査したときの最小二乗推定値、いわば「センサス係数」だと考えてもよいし、$\tilde{X} \beta^*$が$\tilde{Y}$の最良の線形予測となるような係数なんだと考えてもよい。モデル1,3が正しかったらその$\beta$と等しい。しかし、モデル2が正しいときに$\bar{\beta}$と等しいとは限らない。[←ああ、そうかも... 俄然面白くなってきた。センサス係数は混合モデルの係数の加重和じゃないわけだ]
 ところで、モデル3との関係について。$\tilde{U} \gamma + \tilde{\epsilon} = \tilde{\epsilon}^*$だと思えばモデル4と同じことではある。しかしモデル3には、$\tilde{U}$ というか $\tilde{Z}$は本当は観察できたはずの少数の変数なのだ、という含みがある。

 さて、WLS推定量$\hat{\beta}_W$を使うべきなのはどういうときか。

 ここからは、モデル1を支持できるかどうかをデータで決めるやり方について考えよう。調べるのは
 $\hat{\delta} = \hat{\beta}_W - \hat{\beta}$
もしモデル1が正しければ、$\hat{\delta}$の期待値はゼロ。で...
 ここからよく理解できなくなっちゃったんだけど(ちゃんと読んでないからだ、と信じよう)、$Y$の全分散を、{$\hat{\delta}$ で説明できる平方和、ウェイトで説明できる平方和、誤差平方和}に分解するANOVAを考える。結論だけメモしておくと、以下の方法で「ウェイトで説明できる平方和」$SS_W$を求めることができる由。$Z_ij = w_i X_ij$として、$X$と$Z$を説明変数にした$Y$の回帰を求め、ここから$Z$を落としてまた求める。平方和の差が$SS_W$。で、これを$p$で割った値が、帰無仮説のもとで自由度$p$, $n-2p$の$F$分布に従う。
 最後に実例。読み飛ばした。

 。。。モデル2、すなわち層によって回帰係数がちがうんじゃないかと思っていて、その加重和を推定したいと思っている場合には、OLSだろうがWLSだろうが駄目なんだ、というところが勉強になった。いっぽう、これまでに「ウェイティングして回帰してください」と言われた場面で漠然と想定されていたのはモデル4に近いと思う。

 疑問点が2つ。
 その1。モデル4の立場で、俺はセンサス係数を知りんたいんだ、と割り切って考えることができる場面とはどういう場面だろうか。推定した係数に対して、層間の異質性を無視して実質的な解釈を与えるならば(そうなることが多いと思う)、それは途中でモデル1に視点をすり替えたことになる。前から思っているんだけど、「データ生成メカニズムがどうなっているのか知りませんけど、とにかく母集団を全数調査したときに得られるであろう係数を推定しました」っていうのは、なんというか、すごく実査担当者的な発想だと思うんですよね。かつて私の上司様がシニカルに呼んでいた、「コンナンデマシタケド」的データ解析だ。 その係数をどう解釈せえというの?という問いに対しては、ごにょごにょと言葉を濁すわけである。胸が痛むので大きな声ではいえないけど、それはちょっと不誠実なんじゃないかしらん。
 もっとも、係数を実質的に解釈するつもりがなく、単に「これから同一母集団から単純無作為抽出する標本に適用できる最良の線形予測式」を求めることに関心があるのだ、ということであれば、それはそれで納得するけど。その場合のWLS推定量とは、学習データ(層別抽出)と検証データ(無作為抽出)で層の割合が違うので学習時に修正しておきたい、という話として捉えられるのではないかと思う。
 その2。層別抽出においてモデル3ないし4の立場をとったとして、WLS推定量が一致性を持つことはわかったけど、それは最良な推定量といえるのだろうか? もっと良い推定量があったりしないのでしょうか。WLSって、誤差分散の不均一性に対処するために、誤差分散が大きそうな個体に小さなウェイトを与える方法だと思うんだけど、層別抽出の際のウェイトとはあくまで抽出確率の逆数であって、誤差分散とは関係ないと思うんですよね。WLSじゃなくて、個体尤度に重みをつけた最尤法を使うってんなら、なんとなく納得するけど... SASのproc surveyregやRのsurveyパッケージはどうなっているんだろうか、ヒマになったら調べてみよう。

論文:データ解析(2015-) - 読了:DuMouchel & Duncan (1983) 回帰分析も「ウェイト・バック」すべきでしょうか

2016年5月15日 (日)

 グローバル・マーケティング時代のマーケティング・リサーチにおいて(←かっこいい書き出し)、リサーチャーを苦しめる新たな難題リストのトップに躍り出たトピックがあると思う。AskingからListeningへとか?ビッグデータ活用とか?まさか。どなたも言わないのでひとりで勝手に呟くけど、 測定不変性(MI)の問題こそがそれだ。巷に溢れる実務家向け参考書のどこにも書いてないのが不思議なくらいだ。そういう本当に深刻な問題には、きっとみなさんご関心がないのであろう。面倒くさいもんね。
 このたびもMIの問題で延々悩む事態が生じ、とりあえず知識のアップデートのためにと思って昼飯のついでに手に取ったのだが、いかん、油断していたら、聞いたこともないようなアプローチが出てきている...

van de Schoot, R., Schmidt, P., Beuckelaer, A.D., Lek, K., & Zondervan-Zwijnenburg, M. (2015) Measurement Invariance. Frontiers in Psychology, 6, 1064.
 この雑誌のMI特集号のEditorial。まずMIという問題についてごく簡単に触れたのち、MIへのアプローチを4つに整理し、先行研究と掲載論文を紹介。

MGCFA。70年代のJoreskog, Sorbom に始まる伝統的アプローチである。

MIの欠如への対処。

近似的MI。

MGCFAよりもっと複雑なモデルにおけるMIのテスト。

 。。。特に国際調査の場合がそうなんだけど、MIが失われる主要な原因のひとつはresponse styleのちがいなので、そっちに言及がないのがちょっと残念。まあ考えてみると、MIの文脈では、DIFとかがある特定の項目を削ったりなんだりしてMIに到達するのが目的になるのに対して、response styleの文脈では項目共通のscale usage heterogeneityを仮定してそれを修正するのが目的になるので、研究が重ならない、というのはわかる。実務場面では、項目セットにおけるDIFとresponse styleはたいてい手を取り合って襲いかかってくるんだけど。

論文:データ解析(2015-) - 読了: van de Schoot, et al. (2015) 測定不変性の最前線

2016年5月 7日 (土)

Bowling, N.A., Huang, J.L., Bragg, C.B., Khazon, S., Liu, M., & Blackmore, C.E. (2016) Who cares and who is careless? Insufficient Effort Respoinding as a reflection of respondent personality. Journal of Personality and Social Psychology.
 調査にいいかげんに回答する傾向(IER)とパーソナリティとの関係についての研究。
 すぐには役に立ちそうにない話だし(調査対象者をパーソナリティでスクリーニングするわけにもいかない)、ちょっとお気楽すぎるテーマだし(心理学専攻の卒論とかでいかにもありそう)、普段なら食指が動かないのだが、掲載誌がJPSPってところにひっかかった。ま、仕事に役立つかも知れない、ってことで...

 個々の調査参加者のIERの測り方については、この論文にはあまり説明がなくて、先行研究をみないといけない模様。項目間で回答の矛盾があるとか、「ありえねー」回答とか、そういうのを使っているみたいだ。
 以下、内容メモ:

 調査にいいかげんに回答する傾向(insufficient effort responding, IER)の先行研究:

本研究では、

実験は5つ。

研究1。IERとFFMの関連性、IERの時間的一貫性を調べる。
 大学の人事部門と組んで職員を調査。13ヶ月おいて2回実施(T1, T2)。T1とT2の調査項目は同一で、パーソナリティとかいろいろ訊いている。 ほぼ全員がオンラインで回答。匿名回答だが2回の回答をマッチングできる。両方回答してくれた166名(11%)について分析。
 IERの指標については、Curran (in press JESP), Desimone, Harms, & Desimone(2015 J.Org.Behav.), Huang et al. (2012) Maniaci & Rogge (2014), Meade & Craig (2012)をみよ。まあとにかく、Overall IER indexというのとその4つの下位指標を出したんだそうな。
 結果: 指標のT1の値とT2の値は高く相関。ただし同一調査での指標間相関も高い。

研究2。IERの状況間一貫性を調べる。
 被験者は学生。スクリーニング調査でデモグラなどを聴取。24日後、本調査でパーソナリティとか生活満足とかを聴取。調査者も違うしウェブサイトのURLもデザインも違うし報酬も違うから、つまり状況が異なりますよね[←く、苦しい理屈だ...]。両方答えた759名を分析。
 スクリーニング調査では5項目でIERを測った[よくわかんないけど項目間での回答の矛盾を調べているみたい。Huang et al. (2015)をみよとのこと]。
 本調査では... [めんどくさいので読み飛ばした。まあとにかく、調査回答やら反応時間やらをつかって、Overall IER indexとその下位指標を出したらしい]。
 結果:IER指標は調査間で相関。

研究3。別の目的でとったデータを使ってIERの状況間一貫性を調べる。初回調査ののち、6週にわたってオンラインで週次の記録を付けさせる実験であった。被験者は学生229人。
 初回調査にはinstructed-response項目が混ぜてあったので(「この項目ではstrongly agreeをチェックしてください」というような項目)、そういうのを使って、Overall IER indexとその下位指標を出した。週次記録は、提出有無と、別の評定者による「努力して回答しているか」評定をIERの指標とする。
 結果:IER指標は状況間で相関。

研究4。IERとパーソナリティ(ビッグ・ファイブ)の関連性を調べる。さすがにパーソナリティも同じ質問紙で測るってわけにはいかないので(そこでIERが起きるかもしれない)、知人の報告を使う。仮説は次の通り:

被験者は研究3と同じプールの学生。パーソナリティとかいろいろ訊いておいて、そこからOverall IER indexとその下位指標を出した。さらに、メールで知人をひとり紹介してもらい、その知人に質問紙を送って5因子を評定。International Personality Item Poolというサイトから拾った項目、因子あたり10問。データが揃った217人を分析。
 結果: 統制性と協調性はIERと負の相関を示したが、開放性は無相関。開放性の測定が難しいせいかもしれないし、他者評定だったからかも知れない[←往生際が悪い...]。なお、感情的安定性も外向性もIERと負の相関を示した。これは今後の課題。

研究5。IERとGPA・講義欠席率との関連性を調べる。これらはパーソナリティの外的基準として広く用いられているから[←いやいやいや... 学生のIERと講義欠席率の相関が高かったとして、その共通の原因がパーソナリティだっていう説明にはかなーり無理があるんじゃないですかね? 普通に考えれば、その2つの背後にあるのは学業への熱意なのではないかしらん]。GPAとは負の相関、講義欠席率とは正の相関が想定される。
 被験者は学生、349人を分析。パーソナリティとかいろいろ訊いて、そこからOverall IER indexとその下位指標を出す。GPAと講義欠席率は自己報告。
 結果: 仮説を支持。

 この研究の含意:

  1. IERは個人差の結果だよ。もちろん状況要因もあるでしょうけど。
  2. 自己報告質問紙を使う皆さん、IERに気をつけようね。IERを測って高い人のデータを捨てるとか、どうにかしてIERを予防するといった方法が提案されているけど、前者はパーソナリティの分布を歪めることになるかも。

 今後の課題:

 本分析の限界: [略]

 。。。要するに絵に描いたような相関研究である。当然ながら、考察もあんまし突っ込んだ話にはならない。こういうのでもJPSPに載るのか。

 結局のところ、多様な状況を通じて観察される行動傾向の背後にあるもののことをパーソナリティと呼ぶんだから、どんな行動領域であれ、個人差とパーソナリティとの相関を調べれば、そりゃあなにかは見つかるでしょう?と思う次第である。その相関が、当該の行動を生起させるメカニズムに新しい光を投げかけてくれるんだとか、あるいはパーソナリティそのものに新しい光を投げかけてくれるんだってんなら、それは素晴らしいですけど、ただ単に、やった!相関がありました!っていわれてもなあ...
 個人的には、こういう話にはあんまし関心無くて、むしろIERが起きるメカニズムの一端でもわかるとありがたいんですけどね。それを手がかりに調査手法を改善できるかもしれないから。

 あれじゃないかしらん。こうやってビッグファイブとの関連なんか調べてないで(ごめんなさい)、なんかプライミング手続きで認知を方向づけて、その結果IERが変わることを示したほうが、全然面白いんじゃないかしらん。たとえば、恐怖管理理論に基づき予測した通り、死のイメージを想起させると誠実さという伝統的価値観が顕在化し、社会調査に対するいいかげんな回答は減りましたとか。しかしそれはマジメそうな社会調査の場合であって、マーケティング・リサーチとかなんのためにやってんだかわかんない心理学の調査とかに対しては、逆にいいかげんな回答が増えちゃいましたとか。はっはっは。

論文:調査方法論 - 読了:Bowling et al. (2016) 調査にいいかげんに回答する人のパーソナリティ

2016年5月 6日 (金)

Diderrich, G.T. (1985) The Kalman filter from the perspective of Goldberger-Theil estimators. American Statistician, 39(3), 193-198.
 題名の通り、Goldberger-Theil推定量とカルマン・フィルタとの関係をあきらかにしましょう、というマニアックな論文。先日の原稿準備の途中で疑問に思って、試しに読んでみた奴。
 難しくてわからんことは覚悟の上である。たまに理解を超える論文を無理やり読むことによって、人の精神は鍛えられ、深い絶望に耐え抜く力を身につけることができるのだ、と自分に言い聞かせつつ。

 内容を一応メモしておくと...
 まずは準備から。
 $y = X b + e$
の$b$のBLUEな推定量$\hat{b}$について考えよう。BLUEってことはunbiasedかつbest、すなわち$E(b-\hat{b})=0$かつ$cov(\hat{b}-b)$がトレース最小である。$\hat{b}$は下式で与えられる:
 $\hat{b} = P X' W^{-1} y$
ここで$W$は$e$の共分散。$P$は推定誤差の共分散行列$cov(\hat{b}-b)$であり、具体的には
 $P = (X' W^{-1} X)^{-1}$
である。
 これをGauss-Markov-Aitken定理という[←へえええ?知らなかった。ガウス-マルコフ定理という言い方は聞いたことがあったけど]。最小二乗法の入門書では、この定理は
 $(y-Xb)^{-1} W^{-1} (y-Xb)$
を最小化する問題として紹介されている。確率的・分布的な仮定がないところにご注目。

 こんどは、いわゆる逆行列の補助定理(matrix inversion lemma)について。以下、行列は必要なときに逆行列を持つものとする。
 $P_1^{-1} = P_0^{-1} + X' W^{-1} X$
が成り立つのは、以下のすべてが成り立つとき、そのときに限る:
 $P_1 = (I-KX) P_0$
 $P_1 P_0^{-1} = (I-KX)$
 $K = P_0 X' [W + X P_0 X']^{-1}$
 $P_1 X' W^{-1} = K$
[証明略。文系の私としては、わざわざ変な記号を使っておまえは何を言っているんだという感じだが、あとで意味がわかると信じて先に進もう]

 では、いよいよ本題です。
 $\hat{b}_0 = b + e_0$
を$b$の事前推定値とする。$e_0$の分散を$P_0$とする。当面$b$は定数とする。
 これを上の
 $y = X b + e$
とどう結合するか。ひとつの路線は、以下の式を最小化するという路線である:
 $(b-\hat{b}_0)' P_0^{-1} (b-\hat{b}_0) + (y-Xb)^{-1} W^{-1} (y-Xb)$
もうひとつの路線はこうだ。ベクトル$y$と$\hat{b}$を縦積みし$y_1$とする。行列$X$と$I$を縦積みし$X_1$とする。ベクトル$e$と$e_0$を縦積みし$e_1$とする。すると上の2本の式は
 $y_1 = X_1 b + e_1$
これにGauss-Markov-Aitken定理を適用し、BLUEな推定量
 $\hat{b_1} = P_1 X_1' W_1^{-1} y_1$
を得る。これをばらしていくと、
 $\hat{b_1} = P_1 X' W^{-1} y + P_1 P_0^{-1} \hat{b}_0$
となる。これをGoldberger-Theil推定量という。
 さて、この式に逆行列の補助定理を適用すると[...中略。なるほど、このときのために変な記号を使っていたのね...]
 $\hat{b}_1 = \hat{b}_0 + K (y - X \hat{b}_0) $
が得られる。なんと、古い推定量にイノベーション$y - X \hat{b}_0$を足しているぞ。これはカルマン・フィルタではないか。

 $b$が確率変数であっても、$e_0$, $e$と独立であればこの関係が成り立つ[説明を大幅に略]。

 さらにだ。事前推定値$\hat{b}_0$を0とし、$P_0=I(1/k)$, $W=I$とすると、
 $\hat{b} = [kI + X'X]^{-1} y$
となる。なんと、これはリッジ推定量ではないか。このようにリッジ推定量とは、事前情報$\hat{b}$は使わないが$P_0$は使う、「半」カルマン・フィルタなのである。

 [最後に、この結果を使って一般化カルマンフィルタを導出しよう...という話。力尽きたのでパス]

 というわけで、カルマン・フィルタ理論と線形最小二乗理論のつながりがあきらかになった。
 60年代初頭、工学ではカルマン・フィルタが登場し、統計学ではGoldberger-Theil推定量が登場した。多くの人々が同じときに違う場所で同じことを考えていたわけだ。

 。。。やれやれ。最後の一般化カルマンフィルタの話がよくわかんなかったけど、いいのよ! 文系だから! 次にいこう次に。

論文:データ解析(2015-) - 読了:Diderrich (1985) Goldberger-Theil推定量からみたカルマン・フィルタ

« 2016年4月 | メイン | 2016年6月 »

rebuilt: 2020年11月16日 22:40
validate this page