2015年6月17日 (水)
ホントはこんなことしている場合じゃないんだけど、メモが出てきたので...
Mikulic, J., & Prebezac, D. (2011) A critical review of techniques for classfying quality attributes in the Kano model. Managing Service Quality, 21(1), 46-66.
久々に狩野モデル関連の論文。著者らはクロアチアのツーリズム研究者で、狩野モデル関連でよく名前を見かける。
4年くらい前、狩野法に関する資料を集めまくり朝から晩まで読み倒したことがあったのだけど、その際には未読のまま時間切れになっていた奴だ。先日仕事の都合で掘り出してメモを取ったんだけど、記録するのを忘れていた。
マーケティング・経営の文脈での品質属性の分類手法をレビューする。発想としては、狩野モデルでいう"must-be", "attractive", "one-dimensional" の3分類が前提となっていて、実際に品質属性をどうやって分類するか、というのがお題である。
イントロは飛ばして...
狩野法。個々の対象者に、「もし(属性)が充足されていたらどう思うか」「もし(属性)が充足されていなかったらどう思うか」と尋ね、2問への回答をカテゴリ化して集計し、属性を分類する。狩野らの元論文に沿って紹介(つまり属性分類まで、Better-Worseマップはなし)。
ここでなかなか面白い議論になるので、細かくメモしておくと...
著者いわく。仮に、ある特定の製品・サービス属性が充足している(いない)ということがどういうことかが明確に定義されているならば、その属性についての顧客の感覚を評価する手法として、狩野法の理屈は論理的に妥当である。しかし、「充足」「非充足」の定義があいまいな場合は、深刻な問題が生じる。[←そうそう、そうなのよね... となぜかオネエ言葉に]
たとえば次のようにいう人がいる。<「魅力的」な品質属性とは、それが達成されたときには顧客満足が引き起こされ、しかしそれが達成されていていなくても不満は引き起こされない属性だ>と。しかし、同じ人が舌の根も乾かぬうちにこんな云い方をする。<「魅力的」な品質属性とは、そのパフォーマンスが高いときにそれが顧客満足に与えるポジティブな影響が、そのパフォーマンスが低いときにそれが顧客満足に与えるネガティブな影響よりも強い属性である>と。さらには、これらの定義を一緒にして次のように述べる人もいる始末である。<「魅力的」な品質属性とは、それが存在するときないしそのパフォーマンスが十分なときには顧客満足を引き起こすが、ぞれが存在しないときないしそのパフォーマンスが不十分であっても不満を引き起こさない属性である>と。
ここには、ある属性が供給(provision)されているか否かについての消費者の評価は、その属性のパフォーマンスの高さ/低さについての消費者の評価と同一だ(ないし少なくとも類似している)、という暗黙的な仮定があるわけだ。この仮定を受け入れるならば、「充足」「非充足」を存在という観点から定義しようがパフォーマンスという観点から定義しようが、狩野法が提供する属性分類は同じだ(ないし少なくとも類似している)、ということになる。
さあ、ほんとだろうか。学生を被験者にして次の設問文を試してみた。お題は携帯で使うネット銀行サービス。
- a. 属性提供型。「開設した口座にモバイルサービスがついていたらどう思いますか?」「開設した口座にモバイルサービスがついていなかったらどう思いますか?」
- b. パフォーマンス型。「開設した口座のモバイルサービスがとてもよかったらどう思いますか?「開設した口座のモバイルサービスがとてもひどかったらどう思いますか?」
a.の設問文だと魅力反応・無関心反応が増え、b.の設問文だと一元的反応・当たり前反応が増えた[つまり、bだとdysfunctional項目でdislikeが増えたわけね]。
二つの点を考慮する必要がある。(1)「充足」概念の操作的定義をパフォーマンス型で行うとすごくバイアスがかかる。(2)a.とb.はそもそも状況がちがう。a.では属性のパフォーマンスが良いことが含意されているが、b.ではパフォーマンスは良いかもしれないし悪いかもしれない。
本来、狩野法の属性分類を決めるのは、属性のパフォーマンスではなく、(多かれ少なかれ)期待されているベネフィットが提供されているかいないかである。また、狩野モデルが問題にしているのは客観的パフォーマンスであって知覚されたパフォーマンスではない。パフォーマンス型の方法では狩野法の分類の信頼性が失われてしまう。本来、狩野法の設問文はこうであるべきだ。
- c. ベネフィット提供型.「開設した口座に、取引を携帯電話で管理できる可能性が提供されていたらどう思いますか?」「開設した口座に、取引を携帯電話で管理できる可能性が提供されていなかったらどう思いますか?」
もっともこのやり方だと、属性が全体満足に与える影響についてはわからなくなってしまう。つまり、モバイルサービスが不満よりも満足をつくりだす可能性が高いということはわかっても、その属性が口座についての全体的判断においてどのくらい重要かはわからないし、他の属性とどう関連しているかもわからない。
penalty-reward constrast analysis (PRCA)。Brandts(1987) が提案した。個々の対象者に、全体満足と属性のパフォーマンスを聴取する。で、属性のパフォーマンスを「すごく低いか」「すごく高いか」の2つのダミー変数にコーディングしなおす(たとえば、7件法で訊いておいてTopBoxとBottomBoxだけをコーディングする、とか)。で、全体満足を従属変数にし、単回帰なり重回帰なりシャープリー値なりを求める。属性数が多いときは先に因子分析しちゃおうなどという提案もある由(著者は否定的)。
利点: 属性をその相対的重要性で区別できる。欠点: 存在しない属性は調べられない。また、狩野法が結局は属性の物理的パフォーマンスと属性への満足の関連性を調べているのに対して [←著者の立場からいえばそうなりますね]、PRCAは属性の知覚されたパフォーマンスと全体満足との関連性を調べているわけで、比較にならない。
importance grid (IG)。IBMのコンサルタントが考え出したといわれている。重要性の直接評定を横軸、統計的な重要性 (標準化偏回帰係数とか)を縦軸にとって、属性の散布図を描く。右下はmust-be, 左上がattractive, 右上・左下がone-dimentional。
利点:直接評定は期待の指標、統計的重要性は満足へのインパクトと捉えられ、その点では狩野法の精神に合致している。欠点:満足-不満の非対称性を捉えていない。相対的な分類であり、属性セットに依存する。
質的データ手法。クリティカル・インシデント・テクニック(CIT)や"analysis of complaints and compliments" (ACC)のこと。信頼性は疑わしいが、特定の製品・サービスに対する満足・不満の源を同定するためには有効。
直接分類。対象者に直接分類してもらう[ははは]。実現しにくいし、信頼性に欠ける。
というわけで、(狩野法を客観ベースと知覚ベースにわけて) 計6個の手法の星取表を示す。
考察。属性のパフォーマンスを客観ベースで捉えるか知覚ベースで捉えるかでいろいろ違ってくる。
- 時間的変化。客観ベースだと時間的に変化しないはずだが、知覚ベースでみると変化する。
- 顧客の反応。80年代初頭、テレビのリモコンは客観ベースでは魅力属性だったが、知覚ベースではリモコンの出来がひどかったかも。ということは、魅力属性が不満のもとになりえることになってしまう。[←これは品質分類を客観ベースで行った場合の話ではないかしらん。まあ、著者がここでいっているのは、どっちかの視点に立ち続けないと話が矛盾するということなのだろう]
- すなわち、(客観ベースでの)魅力属性は、現実世界では魅力属性ではないことになる。
- 狩野モデルにおいて信頼性があり理論的妥当性がある品質分類は客観ベースの品質分類だ。でも客観的パフォーマンスは測れない。つまり狩野モデルには概念的な欠陥がある。
- 狩野モデルを適用する際には属性の充足/非充足をベネフィットの提供/非提供として記述すべきだ。
。。。うーむ。いろいろ勉強になる内容であったが、著者がいわんとするところがいまいちよく理解できていない。
狩野法において属性の充足を認知的に捉えるか物理的に捉えるかが論者によって違うという点は、著者は引用してないけどLilja & Wilkund (2006)も指摘していた点であった。ふたつの視点を混在させると困ったことになる。それはわかる。
これに対して著者らは、狩野モデルにおける属性の充足は物理的概念として捉えるのが「正解」だ、というスタンスを取る。当然ながらそれはさまざまな運用上の問題を引き起こす(物理的充足/非充足を記述するのは結構難しい)。著者らにいわせれば、つきつめていえばそれは狩野モデルの概念的欠陥なのだが、狩野モデル属性の充足/非充足をベネフィットの提供の有無として記述することで克服できる... ということになるのだろう。
よくわからなかったのは、なぜ属性の充足を客観的に捉えるのが「正解」なのか、という点である。それは分析手法のユーザが決める問題であろう。ここで測定の信頼性の話をするのは本末転倒なのではないか。人は測れるものを測るのではなく、測りたいものを測ろうとすべきではないか。
物理的品質と知覚品質は異なる。顧客の知覚品質に介入するマーケティング・アクションは製品改善以外にもありうる(コミュニケーションによる期待の操作とか)。だから、著者が何と仰ろうが狩野先生がなんと仰ろうが、私は属性の充足を認知的概念として捉えたい、つまり私がやりたいのは、(期待に依存しない)ベネフィット提供の有無と全体評価との関係という観点からみた属性分類ではなく、(期待からの差異としての)知覚品質と全体評価との関係という観点からみた属性分類なのだ... という人がいても、ちっともおかしくない。この人に向かって「あなたがやろうとしている品質分類は真の狩野モデルじゃない」ということは可能だろう。「あなたがやろうとしていることは真の意味での品質分類じゃない」ということも、もしかすると可能かもしれない。でも、この人に向かって「あなたがやろうとしていることは間違っている」といえるのか、どうか...?
論文:マーケティング - 読了:Milukic & Prebezac (2011) 狩野モデルに基づく品質属性分類手法レビュー
斎藤恭之 (2013) 米国の「携帯世論調査」の現状と課題:米国世論調査協会の大会に参加して. ジャーナリズム, 2013.1, 46-51.
ひょんなことから拝読。勉強になりました。
論文:調査方法論 - 読了:斎藤 (2013) 携帯世論調査の現状と課題
神山進(1999) 性の商品化と商品価値:ジェンダーを焦点にして. 彦根論叢, 317, 153-175.
ちょっと用事があって目を通した資料のひとつ。
著者いわく、「男性の女性化、女性の男性化によって生み出される性アンドロジニィ(両性タイプ)や性未分化タイプの増加は、伝統的でステレオタイプ化されたジェンダー・カテゴリーからの個人の解放の現れである。また消費が受動的な欲求充足過程であるよりは能動的な自己構築過程であるという傾向も、伝統的なジェンダー・カテゴリーからの解放を促している」とのこと。この引用部分に限らず、けっこう楽観的に捉えておられるところが興味深い。あとで触れている、「自由を手にしたあとで、市場において再度構築された"理想的な"性のイメージに振り回され、逆に人々がジェンダーに強く統制され[...] 自分自身までも商品として消費する」という危険性のほうがまさにリアルな問題だという気がするんだけど。現時点ではどのようにお考えかしらん。
引用文献をメモ:
- ジェンダー・アイデンティティ(gender identity, gender self-concept, sex role identity) と商品選択:Fly(1971 JMR), Vitz & Johnson, 1965 J.App.Psych.), Gentry, et al.(1978 ACR), Stern(1988, Psych.Mktg.), Jaffe & Berger (1988 Psych.Mktg.), Worth et al. (1992 Psych.Mktg.), Gainer(1993, Psych.Mktg.)
- 製品のジェンダー帰属(サンダルは女性らしい、というようなの): Allison, et al (1980 ACR)
論文:マーケティング - 読了:神山(1999) 性の商品化と商品価値
2015年6月16日 (火)
先日たまたま内村鑑三についての本を読んでいて、不敬事件(明治23年)の際に内村宅に押し掛け玄関に小便して帰った一高生の一人はのちの国語学者・保科孝一だという話を目にし、義憤に駆られた。この人の自叙伝を探して該当箇所を読んでまた立腹。 若い日の過ちを反省するというニュアンスではなく、自慢げに書いておるところが気にくわない。国家主義者だかなんだか知らないが、畳に小便はないでしょう。内村さんちのお手伝いさんか誰かが拭いたんだぞ。
浮田真弓(2015) 保科孝一の国語教育研究における国家主義と「国語」の民主化. 岡山大学大学院教育学研究科研究集録, 158, 63-70.
というわけで、ついでにみつけて読んだもの(物好きにもほどがある...)。国語教育史からみた保科孝一論レビュー、という感じの内容であった。イ・ヨンスク「『国語』という思想」という本、面白そうだ。
論文:その他 - 読了:浮田(2015) 国語学者・保科孝一についての論文レビュー
先日から仕事の都合で生存時間(イベント発生時間)データの分析について考えていたのだけど、資料をみていると、サンプリング・デザインの用語がいろいろあって混乱してしまう。同じことを違う名前で呼んでいることもあって、ちょっと困る。
というわけで、クライン&メシュベルガー「生存時間解析」より関連用語をメモ。この本、原題を"Survival Analysis: Techniques for Censored and Truncated Data"というだけあって、サンプリング・デザインの問題についてやたらに詳しい。
1. 打ち切り(censoring)。
- 1.1 右側打ち切り。
- 1.1.1 タイプ I 打ち切り。関心あるイベントが、前もって指定したある時点よりも前に生じたときにのみ観察できる。打ち切り時間は人によって同じでも、違っていてもよい。特殊ケースとして以下がある。
- 1) 進行性タイプ I 打ち切り。打ち切り時間が人によって異なる(これの打ち切り時間を「犠牲時間」ということもある)。
- 2) 一般化されたタイプ I 打ち切り。カレンダー時間でみて、観察開始時点が人によって異なり打ち切り時間が全員で固定されている。Lexis diagramはこういうときに便利 [←あ、なるほど...]
- 1.1.2 タイプ II 打ち切り。n 人の観察対象者のうち r 人でイベントが生じるまで観察する。尤度の決定や推定がちょっと楽になる。r はあらかじめ定められた定数だが、打ち切り時間は確率変数であることに注意。特殊ケースとして以下がある。
- 1) 進行性タイプ II 打ち切り。まず r1 人でイベントが生じるまで観察し、そこで残りの対象者のうちある人数について観察を打ち切る。
- 1.1.3 競合リスク打ち切り。競合リスクを体験した人の観察を打ち切る。特殊ケースとして以下がある。
- 1) ランダム打ち切り。
- 1.1.1 タイプ I 打ち切り。関心あるイベントが、前もって指定したある時点よりも前に生じたときにのみ観察できる。打ち切り時間は人によって同じでも、違っていてもよい。特殊ケースとして以下がある。
- 1.2 左側打ち切り。関心あるイベントが観察開始よりも前に生じていることがあり、生じていたことはわかるがいつ生じていたかはわからない。
- 1.3 両側打ち切り。左側打ち切りと右側打ち切りの両方がある。
- 1.4 区間打ち切り。イベント発生がある区間に生じたかどうかだけがわかる。
2. 切断(truncation)。ある期間中にイベントが発生した人だけが観察される。
- 2.1 左側切断。イベント発生時間が切断時間を超えた人だけが観察される。(この切断時間を「遅延登録時間」ということもある)。
- 2.2 右側切断。イベントがある時間までに生じた人だけが観察される。
やれやれ...
雑記:データ解析 - 生存時間データの打ち切り・切断に関する用語総ざらえ
Gabler, S., Haeder, S., Lahiri, P. (1999) A model based justification of Kish's formula for design effects for weighting and clustering. Survey Methodology, 25(1), 105-106.
なにかの事情で調査のデザインが複雑になり、集計する際に確率ウェイティングしなければならないとき、ウェイティングによって推定量の標準誤差が拡大する。その拡大の大きさを知る方法として、Kishのデザイン効果の公式が有名だけど、Kish先生はなにしろ謙虚な方なので「この扱いは不完全で不十分なものかもしれない」とおっしゃっている。Kishの公式が正しいことを示します。というたった2頁の論文。
多段抽出の状況で、それぞれの観察があるウェイティングのクラスに属している場合を考える。たとえば一次抽出単位が地域、二次抽出単位が世帯で、世帯の世帯人数の逆数をウェイトにする場合、各地域がクラスタで、たとえば「二人世帯」がクラスである。
クラスタを$c=1,\ldots,C$、そのクラスタのサイズを$b_c$、クラスタサイズの平均を$\bar{b}$、級内相関係数を$\rho$とする。クラスを $i=1,\ldots,I$, クラスタ$c$のクラス$i$ [原文では$I$だがミスだろう] に属する観察数を$m_{ic}$、クラスタを通した観察数の合計を$m_i$、クラスとクラスタを通した観察数の合計を$m$とする。Kishのデザイン効果は
${\rm deff}_{Kish} = m \frac{\sum_i^I w_i^2 m_i}{(\sum_i^I w_i m_i)^2} [1+(\bar{b}-1)\rho]$
である。
クラスタ$c$における抽出単位$j$の観察値を$y_{cj}$、ウェイトを$w_{cj}$とする。母平均のデザインベースの推定量は
$\bar{y}_w = \frac{\sum_c \sum_j w_{cj} y_{cj}}{\sum_c \sum_j w_{cj}}$
ですわね。
- $y$の分散と共分散は、クラスと抽出単位を問わず${\rm Var}(y_{cj}) = \sigma^2$, $c=c', j \neq j'$のときに${\rm Cov}(y_{cj}, y_{c'j'}) = \rho \sigma^2$, そうでないときには${\rm Cov}(y_{cj}, y_{c'j'}) =0$であるというモデルを仮定しよう。クラスタ抽出の場面での無理のない仮定である。これをモデル1と呼ぶ。
- もっと強気に、${\rm Var}(y_{cj}) = \sigma^2$、$(c, j) \neq (c', j')$なら常に${\rm Cov}(y_{cj}, y_{c'j'}) =0$、というモデルも仮定しよう。単純無作為抽出の場面でのモデルである。これをモデル2と呼ぶ。
デザイン効果を${\rm deff} = {\rm Var}_1 (\bar{y}_w) / {\rm Var}_2 (\bar{y})$と定義しよう。分散記号の添え字はモデルの番号である。
準備はできた。さて! このデザイン効果の定義をどんどん展開していく。分母はかんたん、$\sigma^2/m$だ。分子${\rm Var}_1 (\bar{y}_w)$をごりごり整理していくと、結局Kishの公式まであともう一歩、
${\rm deff} = m \frac{\sum_i w_i^2 m_i}{(\sum_i w_i m_i)^2} [1+(b^*-1)\rho]$
$b^* = \sum_c (\sum_i w_i m_{ic})^2 / \sum_i w_i^2 m_i$
というところまで持っていける。面倒ではあるが、まあ理解可能な変形であった。
ここでコーシー・シュワルツの不等式を持ちだす。ええと、長さが同じ2本のベクトルについて(二乗和の積)≧(積和の二乗)だ。$b^*$の分母のサメ―ションの内側$(\sum_i w_i m_{ic})^2$が積和の二乗になっていることにご注目。ちょっと工夫して書き換えてからコーシー・シュワルツの不等式を適用すると、$b^* \leq \bar{b}_w$と書ける。ここで$\bar{b}_w$とはクラスタサイズのウェイティングした平均である。クラスタサイズがみな同じなら$\bar{b}$である。つまり、Kishの式はクラスタサイズが等しい場合のdeffの上界を示しているのだ。
... あれれ? Kishのdeffは$w$と$y$が独立だという仮定の下での指標だと思ってたんだけど、その仮定がなくても、Kishのdeffが真のデザイン効果の上界だというところまではいえるってこと?
それともひょっとして、式の展開の途中にこの仮定がこっそり忍び込んでいるのかしらん。いやいや、専門家のなさることだから、そんなズルはないだろうけど。いずれ時間ができたら読み直そう。
論文:データ解析(2015-) - 読了:Gabler, Haeder, & Lahiri (1999) 「ウェイトバック集計」におけるKish先生のデザイン効果の公式が正しいことを示そう
2015年6月11日 (木)
調査におけるウェイティング(いわゆるウェイトバック集計)について、このブログがきっかけでお問い合わせを受け、えええ? いったいこのブログにどんなことを書いてんだっけ... と読み返してみたところ、全然忘れているエントリもあってびっくりした。三歩歩けば全て忘れる、ニワトリなみの記憶力である。
せっかくなので、これまでに書いたウェイティングに関するエントリを時間順に並べてみた。すいません、完全に自分用のメモです。
- 読了:Hu, et al. (2001) 固定電話対象のRDD調査と携帯電話対象のRDD調査を両方やってひとつにまとめました (2015/06)
- 読了:Kalton & Flores-Cervantes (2003) 「ウェイトバック集計」のためのウェイト値のつくりかた(2015/04)
- 読了:Scott(2007) 調査ウェイティングの下でのカイ二乗検定のRao-Scott修正について振り返る(2014/11)
- 読了:Potthoff, Woodbury, & Manton (1992) 調査ウェイトつきデータの分析における「等価標本サイズ」「等価自由度」(2014/03)
- 「ウェイトバック集計」すべき場合とすべきでない場合がある(ということを説明するためのwebアプリを作ってしまった)(2014/03)
- 読了:Patterson, Dayton & Graubard (2002) 複雑な標本抽出デザインのデータに対する潜在クラス分析 (仁義なき質疑応答つき)(2014/03)
- 読了:Asparouhov (2005) 因子分析・潜在クラス分析における確率ウェイティング(または: Mplus 3はこんなにすごいんだぜ)(2014/03)
- 読了:Spencer (2000) 抽出確率が測定値と相関している標本におけるデザイン効果の推測(2014/03)
- 読了:Muthen & Satorra (1995) 複雑な標本抽出デザインのデータに対するSEM(2014/03)
- 読了: Park & Lee (2001) デザイン効果、その知られざる真実(2014/03)
- 読了: Gelman (2007) ウェイティングと回帰モデリングを巡る悪戦苦闘(2014/02)
- 統計ソフトの「ウェイト」は調査の「ウェイト」ではない(2013/05)
- 読了: Eltinge (2001) ウェイト値の算出方法が複数ある時にどっちがいいか決める方法(2008/04)
- 読了: Little & Vartivarian (2005) 無回答の補正のためにウェイティングすると推定量の分散は必ず大きくなるとはいえない(2008/03)
- 読了: Potter (1990) ウェイト値をトリミングする方法(2008/01)
- 読了: Kish (1990) ウェイティング:なぜ、いつ、どうやって(2007/12)
雑記:データ解析 - ウェイティング回顧録 (私は結構ヒマな男なのではないか)
Hu, S.S., Balluz, L., Battaglia, M.P., Frankel, M.R. (2011) Improving Public Health Surveillance Using a Dual-Frame Survey of Landline and Cell Phone Numbers. American Journal of Epidemiology, 173(6), 703-711.
ちょっときっかけがあって、仕事の合間に目を通した。ほんとはこんなことしてる場合じゃないんだけど...
アメリカでBehavioral Risk Factor Surveillance System (BRFSS)という調査をやっている。健康状態とかリスク行動とかについて月次でトラッキングする全米規模のRDD調査だ。ところが、最近じゃ「携帯しか持ってない」という世帯が増えているので、固定電話対象のRDDでよいものかという疑問がある。そこで、2008年に固定と携帯のdual-frame調査の実験をやってみた。そのご報告。
固定RDDのほうは通常のBRFSS調査と同様の手順(従って携帯ユーザも含まれている)。携帯RDDのほうはまずスクリーナで「携帯しか持ってない」人を特定した。他にも、居住州が怪しいのでスクリーナで改めて州を訊かなきゃとか(いちおう番号で州がわかるんだけど、その番号のまま引っ越してることもある)、いろいろめんどくさいことがある由。票単価が全然違っちゃうので(固定の5倍近いそうだ)、最適割当の式を睨み、州ごとに全標本の1割を携帯に割り付けた。
さて、以下の手順でウェイティングします。
まずはデザイン・ウェイト。固定のほうは次の3つのファクターを掛ける。(1)当該州での電話番号の抽出確率の逆数。(2)世帯の成人数。(3)世帯の固定回線数の逆数。携帯のほうは、当該州での電話番号の抽出確率の逆数。
次に、固定と携帯を統合するためのウェイト。州別に、SESで事後層別して合わせるウェイトをつくり、さらに州ごとの電話使用者の推定サイズにあわせるウェイトもつくる。後者のウェイトのつくりかた、超めんどくさいけど、きちんとメモしておくと... まず別の大規模な調査(2007 NHIS)のデータで、成人を次の4群に分類する:(1)固定電話のみ、(2)固定と携帯の両方、(3)携帯のみ、(4)どちらもなし。この電話使用群を従属変数、ソシオグラフィク・デモグラフィック変数を予測子にした国レベルの多項ロジスティック回帰モデルを組む。そのモデルを、また別の調査(2005-2007のAmerican Community Survey)に当てはめ、各州における電話使用群のメンバーシップ確率を予測し、各州の電話使用群のサイズを推定する。なんと面倒な話だろう。死人が出るレベルだ。
最後に最終ウェイトの作成。各州について、年齢x性別(州によってはこれに地域や人種がはいる)を表側、{固定のみ・両方・携帯のみ}を表頭にとった表について周辺分布をあわせる。Proceedings of the SAS Global Forum 2009 Conference に載っているSASマクロを使ってレイキングした。
回答率と結果についていろいろ述べているけど、パス。
考察。携帯電話への調査は金がかかる。回答率は州による。携帯電話のみの人には酒飲み、喫煙者、肉体労働従事者、HIVテスト経験者が多く、金がなくて十分な医療を受けていない人が多く、健康保険に入ってない人が多く、肥満は少なくインフルエンザワクチンとかマンモグラムとか受けてない人が多い(散々だなあ...)。年齢・性別・人種・学齢・収入などを調整してもこの傾向は消えない。要するに、固定電話のみのRDDで事足れり、ってやりかただと結構やばい。というわけで、BRFSSは2009年からdual-frameのRDDをやってます、とのこと。
ふへぇー。世の中にはいろんな問題があるものね。。。
論文:調査方法論 - 読了:Hu, et al. (2001) 固定電話対象のRDD調査と携帯電話対象のRDD調査を両方やってひとつにまとめました
2015年6月 8日 (月)
仕事の都合で、左側切断と右側打ち切りがある生存時間データについて考えていた。恥ずかしながら、両方ある奴を扱うのははじめてだ。わかりやすく書いてしまうといろいろ差し障りがあるので書けないけど、マーケティング・データ解析ではそんなに珍しい問題状況じゃないかもしれない、と反省。
意外なことに、この状況についてきちんと説明した参考書がなかなか見当たらない。社会科学の文脈で生存分析を扱った名著Singer & Willett(2003, 最近訳書が出た)には切断の話が出てこないように思う。Rのsurvivalパッケージの中の人Therneauさんによる教科書Therneau & Grambsch (2010) にもほとんど出てこない(これはラッキーともいえる。私にはこの本はかなりわかりにくい)。いまのところ見つけたのはクライン&メシュベルガー(原著2003)なんだけど、先生、文系の私にはこれでさえハードルが高いんです...
Cain, K.C., Harlow, S.D., Little, R.J., Nan, B., Yosef, M., Taffe, J.R., & Elliott, J.R. (2011) Bias Due to Left Truncation and Left Censoring in Longitudinal Studies of Developmental and Disease Processes. American Journal of Epidemiology, 173(9), 1078-1084.
というわけで、出張の新幹線でメモを取りながら読んだ。
ええと...
縦断研究で、関心がある最初のマイルストーン(発症とか)から最後のマイルストーン(死亡とか)までを観察しているのをインシデント・コホート・デザインという。これに対して、なんらかのマイルストーンを観察できなかった人を除外しちゃうのをプリバレント・コホート・デザインという。後者のデザインにはバイアス源が3つあることになる:
- 右側打ち切り。つまり、観察期間中に関心あるマイルストーンが生じなかった人がいること。
- 左側打ち切り。関心あるマイルストーンが観察期間前に生じたことはわかるけど、その時点がわからない人がいること。
- 左側切断。関心あるマイルストーンが観察期間前に生じた人が研究から除外されていること。
生存分析による右側打ち切りの対処は広く活用されているが、左側打ち切り・左側切断はそうでもない。
左側切断によるバイアスは、切断に関わっているマイルストーンがひとつならまだわかりやすい。ややこしいのは複数のマイルストーンと関連しているときだ。たとえば、女性の更年期についての3つのコホート研究を比較すると、後期更年期の開始時点の分布が全然違う。これは研究によっては参加時にもう後期更年期が始まっている人がいたり(左側打ち切り)、更年期が終わっちゃった人が研究に参加できなかったり(その後のマイルストーンによる左側切断)するからだ。[←ああ、そうか。この例ならすぐ気が付くだろうけど、こうやって対象者条件が複雑になればなるほど、思わぬ落とし穴も増えるなあ...]
終末イベント時の年齢をY、中間イベント時の年齢をXとする(たとえば、更年期の終了と後期更年期の開始)。D=Y-Xとする。Y, X, Dの分布を推定するというのが目標である。
研究参加時の年齢をA, 退出時の年齢をBとする[←ここではすべてをカレンダー時間ではなく年齢で定義している点に注意。いやあ、途中で混乱したぜ。Figure 1をぼーっと見ていると誤解するぞ]。可能な順序は6つある: AXYB、AXBY、ABXY、XABY、XAYB, AYAB。
ここでは次のデザインに焦点を当てる。
- デザインI. Xで左側切断されているデザイン。つまり、XABY, XAYB, XYABが除外されているデザイン。
- デザインII. Yで左側切断されているデザイン。つまり、XYABが除外されているデザイン。XABYとXAYBは含まれている、つまりXは左側切断はされてないけど左側打ち切りは生じているわけだ。
デザインIについて。[←混乱するので自分のために例を挙げておくと、分析対象期間前に退会した会員はデータから抜け落ちているけど、現会員についての入会日はわかる、会員の在籍期間(入会日を原点にとってX)の平均を推定せよ、といわれているような状況だ。ありそうありそう]
Xの左側切断を無視してYなりXなりDなりの分布を推定したとして、仮にAが固定されていたなら、その推定は X > Aという条件のもとでの条件付き分布となる。実際にはAはたいてい変動するけど。
このデザインでは、Aを組み込んでXの周辺分布を不偏推定するノンパラなproduct-limit推定量が存在する[←なんのことかと思ったが、カプラン・マイヤー推定量のことをproduct-limit推定量というらしい。へー]。Stata, SAS, Rに載っている。ただし、Aの最小値がXの最小値より早いことが必要。さらに、Aの最小値とXの最小値が近いと不安定になる(リスク集合が小さすぎるから)。こういうときは、Aの最小値の右側にA0という点を定義し、X < A0 の下での条件付き分布を推定するという手もある [←へぇー!]。もちろん周辺分布に対しては不偏でなくなる。
不幸にして、Xの多くがA (ないしA0)より左だったとしよう。Xの周辺分布を不偏推定するためには、もはやXのパラメトリックな分布を知るよりほかに手がない。それがわかれば、尤度を Pr(X < A)で割ればいい[←理解するまで1分ほど固まりました... いやぁ、専門家の奴らは頭がいい]。StataとRのサンプルコードを示すから読むがよい。
ところで、すべての潜在的参加者について、Aの前にXがあったかどうかだけはわかっているとしたらどうか。この場合は、Xで左側切断されているのではなく、Xで左側打ち切りしていることになる。これもコードを示すので読め。
さて、ここまでの話はXが正しくわかる場合の話だ。実際には往々にしてXはあいまいである。更年期の例だと、生理周期が60日を超えた初回を後期更年期の開始と定義するんだけど、ある参加者の生理周期が「はじめて」60日を超えたと参加者が報告したとして、実は観察期間の前にもそれは生じていたかもしれない。以下、参加者の報告を信じる方法をナイーブ法と呼ぶ。
デザインIIについて。おさらいすると、イベントYで切断、Xで打ち切りが生じてます。[←分析対象期間前に退会した会員はデータから抜け落ちており、入会日(カレンダー時間でX)については新規会員についてはわかるが既存会員についてはもうわからん、会員の在籍期間(退会日をカレンダー時間でYとしてY-X)の平均を推定せよ、でも新規会員のみの平均じゃだめよといわれているようなものか。悪夢ではあるがありそうな話でもある]
このときは、まずXとYの同時分布のモデルが必要になる。XとYが独立でないかぎり、Yの切断がXの分布の推定にバイアスをもたらすからだ。二変量正規分布を仮定したモデルのコード例を示すから読め。
なお Jiang et al.(2005 Biometrics)は、XとYの関係についてはパラメトリックに記述しそれぞれの周辺分布についてはノンパラに推定するというモデルを提案している。[←なんでそんな変なことを考えたのかと思ったら、Xは糖尿病性網膜症、Yは糖尿病による死亡だそうだ。なるほど、観察開始前の死亡者はデータから抜け落ちる、網膜症を発症したかどうかはわかるが時期は観察期間でない限りわからない、発症からの平均余命を推定したい、発症年齢の確率分布はわからないけど発症から死亡までの期間についてはなんらかの仮定ができそうだ]
シミュレーション。
TREMINというコホート研究をつかう。参加者は女性で、ずっと生理を記録している。40歳の時点で参加していた人の40歳以降の記録を分析対象とする。後期更年期の開始年齢をX, 閉経年齢をYとする。XとYの周辺分布は正規分布に従っているが、Dは歪んでいる(定義上 X > Yにはならないから当然だ)。でも二変量正規性を仮定して分析するぞ。詳細は付録をみよ。[←すんません、いまちょっとその時間がないっす]
TREMINには左側打ち切りも左側切断もない。このデータで推定したX, Y, Dの分布を、このデータから以下の手順で抜き出したデータで推定した結果と比較する。(1)ある期間(たとえば40歳~50歳)に参加した人のデータだけ切りだす。(2)ブートストラップ抽出。(3)個々の対象者に一様乱数Aを与え、Aから10年分を切り出す。(4)X < Aの対象者を除外(デザインI)。ないし、Y < Aの対象者を除外(デザインII)。
結果[きちんと読んでないけど...]。左側切断・左打ち切りをちゃんとモデル化しないとバイアスを受ける。正しく扱っても切断されている割合が50%あたりを超えると不安定になる。云々。
考察。関心あるイベントが切断を受けるイベントである場合は簡単で、RやSASやStataで扱える。しかし関心があるイベントと切断のあるイベントがずれている場合はややこしくて、なんらかのパラメトリックな仮定が必要になる。
実際の切断はそんなにシャープじゃなくて、むしろ確率的に生じることも多い。その調整方法は今後の課題。[←ヘックマン・モデルみたいな話か...]
研究デザインを変えて切断をやり過ごせることもある。たとえば自然流産までのイベント時間分析だったら、すべての潜在的参加者について最初の評価の際に過去の自然流産の有無を調べておくとよい。このクロスセクショナルなデータがあれば、縦断データのほうがY > Aな対象者だけであっても、左側切断が左側打ち切りに変わる。
正直なところ本文よりappendixのコード例のほうに惹かれて読んだんだけど、いやー、これはホントに勉強になった。ありがたや、ありがたや。
論文:データ解析(2015-) - 読了:Cain, et al. (2011) 左側打ち切りと左側切断が生存分析に与えるバイアス
2015年6月 4日 (木)
Zeelenberg, M., Pieters, R. (2004) Beyond valence in customer dissatisfaction: A review and new findings on behavioral responses to regret and disappointment in failed services. Journal of Business Research, 57, 445-455.
前から気になってストックしていたんだけど、このたびちょっと機会があって目を通した。著者については全然知識がないが、Bagozziと共著があるし、雰囲気的にも心理畑の人であろう。google scholar上の被引用回数は結構高め。
サービス利用を通じて生じた感情は顧客満足やその後の行動にどう影響するか。著者ら (Bagozzi, et al. 2000. in "The why of consumption") の整理によれば、モデル化のアプローチがふたつある。
- 感情価ベース・アプローチ。ネガティブ感情は不満を、ポジティブ感情は満足を引き起こす。行動に対する効果も同じ。このアプローチの良い点は倹約性。どんな感情でもひとつの満足-不満に変換される。
- 特定感情アプローチ。感情を種類に分けて扱う。たとえば、失望は不満に強く影響するが、恥はそうでもない。さらに、満足-不満に対する効果と行動に対する効果は異なる。つまり、サービス研究の観点(行動に関心を持つ観点)からは、満足-不満だけ調べていてはいけないことになるわけだ。このアプローチの背後にはcognitive appraisal theory があって...云々。
というわけで、後者を推します、という論文。
この研究では後悔と失望に焦点を当てる。理由: (1)意思決定において重要だと思われるから。[詳細略] (2)似てるから。(3)著者らがこれまでも研究してきたから。
なお、顧客不満が失望だけでなく後悔によっても決まるという研究はすでにある。
- Inman et al. (1997, Mktg.Sci.): くじを使った統制実験。自分の決定についての評価は選ばなかったくじのアタリハズレに影響される。
- Taylor (1997, Mktg.Letter): 映画を選択させる。選ばなかった映画の質の期待値が選んだ映画の満足度に効く。[← へー、面白いなあ]
- ほかに、Herrmann et al.(1999 Euro.Adv.Consum.Res.), Tsiros(1998 OBHDP), Tsiros & Mittal(2000 JCR)。
概念モデル。不満ののちの行動として次の4つに注目する。
- スイッチング。後悔はスイッチングに効くだろう。失望は効かないだろう(失望は代替選択肢がなくても生じるから)。
- クレーム(complaining)。失望はクレームに効くだろう。後悔は効かないだろう(自分の選択が悪かったと思っているわけだから)。
- クチコミ(WOM)。共感を求めるクチコミには失望が、推奨するクチコミには失望と後悔の両方が気くだろう。
- 慣性(inertia)。目標志向的行動をなにもしないこと。研究がないので結果は予測できない。
調査。パネルから961人が参加。モデムで調査票を送り返送してもらった、とある。時代だなあ。
サービスに不満を感じて後悔した経験を思い出してもらう。後悔してたら失望もしてるだろうが、その逆はいえないだろうから、という理屈[←あれれ...いいのかなあ? 過去エピソードを後悔で足切りしているわけで、選択バイアスが起きないだろうか?]。で、そのときの気持ちについて聴取。後悔、失望、不満について各2項目。その後の行動について、クレーム4項目、クチコミ3項目、スイッチング3項目、慣性2項目。すべて7件法。
結果。失望と後悔で不満を説明する回帰をやるとどっちも効いている。スイッチング・クレーム・クチコミ・慣性を目的にした多変量重回帰をやると[←それが重回帰の繰り返しよりも偉いのだと一段落使って述べている。微笑ましい]、失望・後悔・不満はすべて有意。細かく見ると、不満と失望はスイッチングとクレームとクチコミに効く。後悔はスイッチングとクチコミに効き、さらに慣性に効く(後悔しているとむしろなにもしなくなる)。クレームには効かない。
考察。
特定感情アプローチは有用だ。満足-不満は行動に効く(感情価アプローチで考えられていたよりももっと)。
さらに、特定感情が行動に直接効く。後悔はスイッチングを引き起こすがクレームは引き起こさない[ここで後悔がクチコミに効いちゃった理由についてごちゃごちゃ言い訳しているが、省略]。失望はクレーム、クチコミ、スイッチングを引き起こす。別の種類の感情もきっと特有の効き方をするだろう。怒りとか。
この研究では、行動の中に慣性というのを入れてみたが...[ちょっと面白い話だけど、疲れたので詳細略]。
なお、感情価アプローチがダメだといっているわけではない。Larazus(1991, "Emotion and Adaptaion")がいっているように[←おおっと... こりゃ心理出身の人だな]、感情をグローバルな少数次元で説明するのは倹約的だし、たいてい有効でもある。いっぽう感情をカテゴリで説明する立場だけがもたらすリッチな洞察もある。Frijda(1986, "The emotions")いわく、これら2つの見方はレベルが違うだけだ。特定の行動傾性のレベルでは感情はカテゴリだし、出来事の価値なり緊急性なりへの反応というレベルでは感情は連続的次元の集合だ。云々。
調査についてはもやもや感があるし(しょせん想起法でしょ? とか、ふつうならもう一指標増やしてSEMでやるよね...とか)、結果は当たり前っちゃあ当たり前なのだが(あるサービスに失望するとクレームにつながるが、そのサービスを選んだことを後悔していてもクレームにはつながらない。そりゃそうだ)、本題は理論枠組みのほうだろう。ストーリーが明快な、良い論文であった。勉強になりましたです。
実をいうと、感情の話だわ、途中でcognitive appraisalというキーワードが出てくるわで、これは途中から適応論的な話が出てくるんじゃないか... 進化の過程でどうのこうのというお話が始まるんじゃないか... と戦々恐々としていたのだが、出てこなかった。助かった。苦手なんです、ああいうの。
この論文の考察の焦点は、決定後の感情をポジ-ネガでみるかもっと細かく見るかにみるかという点にある。でもそれはちょっと置いておいて。あたっているかどうかわかんないけど、勝手にこの研究を自分なりに位置付けしちゃうと...
世の中には顧客満足が大事だという人がいっぱいいる。ところが、実際に顧客満足が高いと儲かるの? 顧客は離脱しないの?といわれると、ああそうだともという説もある一方、そうでもないよ、満足が高くても顧客は平気で離脱するよ、という指摘も多い。これに対するひとつの説明の方向は、満足じゃなくて別の態度指標、たとえば推奨意向を測りなさい、そっちは顧客行動と関連するであろう、という方向で、NPSのライクフェルドさんとかがそうだ。もうひとつの方向は、満足だけじゃなくて別の規定因も押さえなさい、たとえば知覚リスクも測りなさい、という方向。第三に、満足-不満ってのはそもそも多次元的なんだ、という方向に踏み込む手もある。嶋口のアンサティスファクション/ディスサティスファクションの区別がそうだ。
この論文は、不満だけじゃなくてその規定因であるネガティブ感情の種類を押さえなさいといっていることになるので、2本目のラインだろう。そもそも不満には複数種類あるという3本目のラインにはならないようだ。ストーリー上の細かいちがいかもしれないけど、CS調査を企画する立場からは気になるポイントである。
もうひとつ、面白いなあと思ったのは、後悔がスイッチングとクチコミに効くがクレームには効かない、という点。もし、サービスの利用経験がネガティブであることを所与として、それを顧客自身の決定に帰属させ後悔へと転化させる手段がありうるならば(PCパーツのメーカーみたいに徹底した自己責任を訴求するとか)、それはマーケティングの上でどういう意味を持つのか。スイッチングは仕方ないけど、少なくともクレーム処理は減らせるかなあ? 後悔が引き起こすクチコミがどういうクチコミかを知りたいところだ。
本筋からは離れちゃうけど、決定後の後悔って面白い問題だなあ。私が修士の院生のころ、まだ行動経済学のコの字もなかったころにも、すでに不確実下意思決定の後悔最小化理論というのがあって(Looms&Sugdenだっけ...)、当時の友人と、喫茶店のようなところでその含意についてその熱く語り合った思い出がある。なにかCS-ロイヤルティの調査に活かせるような気がするんだけど、よくわからない。だいたい、あれがどこの喫茶店だったかも思い出せない。当時はコーヒー代なんて気軽に払えなかったはずだけど。
論文:マーケティング - 読了:Zeeelenberg & Pieters (2004) 顧客不満の裏にある感情の効果
2015年6月 3日 (水)
紺田広明・清水和秋 (2015) 動的因子分析による個人内変動のモデル化:心理時系列への同時分析の適用. 行動計量学, 42(1), 69-80。
届いたばかりの行動計量学の最新号に載っていたので、ごはん食べながら読んだ。ありがたや、ありがたや。動的因子分析についての日本語の資料はあまり多くないし、心理系の方の書いたものはなおさらだ。
動的因子分析の定式化はいろいろあって、大きく分けて、因子時系列と指標時系列の間にラグつきのパスを引くタイプの定式化と(心理だとMolenaarさんとか)、因子時系列に自己回帰とかをいれる定式化(NesselroadeさんたちいうところのDAFSモデル)がある。この論文、最初の概観ではMolenaarさんが出てきたので前者かと思ったのだが、本編はDAFSのほうであった。
ええと、提案モデルは以下のとおり。
観測変数ベクトルを$y_t$、因子ベクトルを$f_t$とする。測定モデルは素直に
$y_t = \mu+ \Lambda f_t + u_t $
と組む。切片も負荷も時間不変。
で、因子時系列をARMA(p, q)と捉える。
$f_t = \sum_i^p A_i f_{t-i} + z_t + \sum_j^q B_j z_{t-j}$
あああ、めんどくさい... なんでMAなんていれるの... と神を呪ったが(すいません、単に私の頭が悪いだけです)、ブロック・トープリッツ行列を起こすやり方でAmosでできる由。Mplusでもできますわね。
被験者6人に、98日から163日にわたり、毎日調査に回答してもらう。項目はBig Fiveの情動性と外向性(←考察を読むと、別に気分の代理変数として適当に使っているわけじゃなくて、パーソナリティが変動すると真面目に考えておられる模様)。各6項目、7件法評定。調査票の冊子をつくって郵送で回収。(←うわあ、スマホにアプリ入れて経験サンプリング、とかじゃないんだ。大変だな...)
予備分析としてキャッテルのP-テクニック因子分析をやっているけど、そこはあまり関心ないので、申し訳ないけどスキップ。
提案モデルをあてはめます。
ARMAの次数は決め打ちするんだけど、結局 AR(p) にした由 (←ありがとう先生! そうですよ、MAなんて入れたらわけわかんなくなりますよ...)。ブロック・トープリッツ行列を作ってAmosでモデルを組んだ。因子数は2、各因子につき3項目に絞った。因子パターンは時間不変かつ個人間不変に制約するが、因子の共分散と因子間のラグつきパスは自由推定。ああそうか、被験者を群と見立てて、因子共分散と因子の自己回帰構造を群間異質にするわけか。
結果は省略するけど、情動性は自己回帰が強い、おとついの影響を強く受ける人がいた(気の長い人なのかな)、外向性と情動性のラグつきパスが人によって違っていて、これは機制の個人差を捉えているのだろう... というような内容であった。
なぜ因子共分散や因子間ラグつきパスの被験者間等質性を調べないのかしらん? SEMの枠組みでやってんだから簡単に適合度を比較できるだろうに。きっとそういう問題意識の研究じゃなくて、はなっから個体記述志向の研究なんだろうな。
ともあれ、勉強になりましたです。こういうのが日本語で読めるのは嬉しいです。感謝、感謝。
いくつかメモ:
- ブロック・トープリッツ行列の起こし方について、第一著者がRでの方法を日本語で紹介しておられる由。関西大の心理の紀要。
- 調査票の回答スタイルの研究に、田崎・二ノ宮(2013, 社会心理学研究)というのがあるらしい。あっちゃー... 2013年の雑誌原稿のために自分なりに頑張って徹底的にレビューしたはずだったのに、全然!気が付かなかった。残念。その時点では未刊だったのかもしれないが、日本語の論文ってgoogleスカラーとかではなかなか引っかからないので、見落としていた可能性も否定できない。
論文:データ解析(2015-) - 読了:紺田・清水 (2015) 動的因子分析でパーソナリティの時間変動をモデル化する
三菱総合研究所(2015) 平成26年度『教育改革の総合的推進に関する調査研究 〜教育の総合的効果に関する定量的分析〜』報告書. 三菱総合研究所, 2015.3.
文科省の委託研究。仕事のあいまに読んだ。自分の仕事とはぜっんぜん関係ないわけで、ま、趣味としかいいようがない。
前半は先行研究レビューというか、いくつかの先行研究についての詳細な要約。後半は定量調査。国の受託だから住基台帳ベースの郵送調査かなんかやるのかと思いきや、ネット調査を一発掛けて、中三のときの成績とか現職業とかを訊く。SEMをやるのかと思いきや、重回帰やロジスティック回帰を山ほど走らせステップワイズ変数選択...なんというかその、オーソドックスっていうんですか? そういう分析であった。
そんなこんなで、文科系科目の成績が1ポイント上昇すると、年あたり約2000円の税収増加が期待できます、非認知能力(部活やってましたか、とかいうの)が1段階上昇すると子どもが0.02人増えます、とか、なんとか。
なにごとか偉そうなことを申し上げるつもりはさらさらないですし、すぐに納税者づらするのも好きじゃないんだけど、国はこの委託においくら万円をお支払いになられたのかしら、というところにちょっと関心を惹かれました。(→せっかくなので調達情報を調べてみたら、934万円であった)
前半の文献紹介からメモ:
- ミンサー型賃金関数について、川口「ミンサー型賃金関数の日本の労働市場への適用」(2011, RIETI Discussion Paper)というのを読むといいらしい。
- 小原・大竹「子どもの教育成果の決定要因」(2009, 日本労働研究雑誌): 全国学力テストと新生児体重との相関をみているらしい(もちろん個票ではなくて、県別らしいけど)。面白そう。
- Hanushsek "Do better schools lead to more growth?" (2009, NBER Working Paper): 学生の認知能力とGDPの関連。なにを使っているんだろう? PISAかなあ?