2012年4月27日 (金)
Erdem, T., Zhao, Y, & Valenzuela, A. (2004) Performance of store brands: A cross-country analysis of consumer store-brand preferences, perceptions, and risk. Journal of Marketing Research, 41(1), 86-100.
ストア・ブランド(PB)のシェアは、ヨーロッパで高くアメリカで低いのだそうだ。その理由をホーム・スキャン・パネル・データだけで突き止めます、という論文。
こういう研究をする人って、ほんとに問いから出発しているのだろうか? それとも、データを入手できて高度な分析モデルを作れる人が、研究のために問いを探すのだろうか? どちらともいえないんだろうけど、この研究に関する限り、後者の色合いが強いんだろうなあと思う。
いやあ、難しかった、読み通すのがホントに、ホントに大変だった。主因はもちろん私の能力不足だが、いっちゃなんだけど、ちょっとわかりにくいと思うんですよね、と小声でぼやいたりなんかして...
モデルについての説明を抜き書き。ほんとはナショナル・ブランド群とストア・ブランド群の話を並行して進めていくのだけど、仕組みはまったく同じなので、ナショナル・ブランドについての説明のみ抜き出す。各ナショナルブランドを表す添え字は原文では j_n だが、簡略のために j と書く。分散パラメータ\sigma^2_Aや\sigma^2_xにも、原文では添え字A, x にさらに添え字 n がついているのだが、略記する。Eの添え字の順番が途中で入れ変わっているけど、原文ママである。
消費者は不完全な情報しか与えられておらず、したがって製品の品質についてuncertainだろう。[...] そこで以下のように定義する。
X_{ijt} = A_j + x_{ijt}
ただし、X_{ijt}は消費者 i が時点 t において仮にナショナル・ブランド j を買っていたらそのときに感じていたであろう全体的品質水準、A_j はナショナル・ブランド j の(真の)平均的な品質水準、x_{ijt}はi.i.d.な偶然誤差項である。x_{ijt}は、ある消費者が偶然に「不良品」ないし「もうけもの」を得ることを表しうるだけでなく、消費者が品質水準を完全に評価できないというinabilityをも表しうる。[...]消費者はナショナルブランドの品質水準の平均(A_j)についてベイズ更新によって学習する、と仮定する。[...] また、品質水準A_jについての消費者の事前分布は、t=0の時点では正規分布に従うと仮定する。
A_j \sim N(\bar{A}_j, \sigma^2_A)
ただし、\bar{A}_jはナショナル・ブランド j の知覚品質水準の事前平均であり、各消費者において E_{0i}[A_j] = \bar{A}_jとなる。 \sigma^2_Aは、消費者 i が時点 t=0 において知覚した、このナショナルブランドの品質水準の事前分散である。[...] \sigma^2_Aは、ナショナルブランドについての消費者の初期状態でのuncertanity(知覚品質水準についての初期状態の分散、ないし事前分散)を捉えている。[...]消費者の潜在的属性(品質)知覚に付随する偶然誤差項は次のように分布する:
x_{ijt} \sim N(0, \sigma^2_x),
ただし\sigma^2_xは、ナショナルブランドに共通な、経験の変動性である。x_{ijt}は消費者、ナショナルブランド、時点を通じてi.i.d.であると仮定する。[...]消費者はベイズ更新器のようにふるまうのだから、潜在属性水準(たとえば品質)への消費者の期待は、以下のように表現できる:
E_{it}[ A_j ] = A_j + z_{ijt},
z_{ijt} \sim N(0, \sigma^2_{A_{ijt}})
ここで \sigma^2_{A_{ijt}} は、消費者 i の時点 uにおけるナショナルブランド j についての期待誤差であり、\sigma^2_{A_{ijt}}=E[(A_j - E_{ti}[A_j])^2]である。\sigma^2_{A_{ijt}}は、消費者 i が時点 t においてブランド j に対して持つ期待の誤差について消費者 i が持っている分散を示している。それは消費者の品質についての(ないし不完全にしか観察されない属性についての)信念のばらつきを反映し、消費者への知覚されたリスクを表している。[...]時点 t において消費者 i は、ブランド j の経験における驚きの諸要素から、そこに含まれる情報を受け取り、それによって品質水準の平均 A_jについての期待を更新する。したがって、ベイズルールによれば
E_{ti}[ A_j ] = E_{t-1, i} [ A_j ] + \sum_{j=1} D_{ijt} \beta_{ijt} (X_{ijt} - E_{t-1, i}[ X_{ijt} ])
[サメーション記号のインデクスがサメ―ションの外側の添え字と同じになっているので、わけがわからない。おそらく、サメーションの内側の j はすべて同一の別の記号に書き換えたほうがいいのだろう]
ただしD_{ijt}は、消費者 i がナショナルブランド j を使用したときに1, そうでないときに0 となる。[...]\betaはカルマンゲイン係数で、カルマンフィルタリングのアルゴリズムから得ることができる。
\beta_{ijt} = \sigma^2_{A_{ijt}} / ( \sigma^2_{A_{ijt}} + \sigma^2_x )
ここで\beta_{ijt}は、消費者 i が時点 t においてナショナルブランド j の品質水準を評価するとき[正しくは「任意のナショナルブランドの品質水準を比較するとき」だと思う]、ナショナルブランド j の過去の購入から得た情報に与える重みである。[...]
消費者 i は、時点 t において j の品質水準の分散 \sigma^2_{A_{ijt}}も更新する。
\sigma^2_{A_{ijt}} = (1-\beta_{ijt}) \sigma^2_{A_{ijt-1}}
[...]先に述べたようにz_{ijt} = E_{ti}[A_j] - A_j である。さらに、x_{ijt} の平均は 0 だから、E_{t-1, i}[X_{ijt}] = E_{t-1,i}[A_j]である。したがって
z_{ijt} = z_{ijt-1} + \sum_j D_{ijt} \beta_{ijt} (x_{ijt} - z_{ijt-1})
である。
ああでもないこうでもないと、まるまる一晩悩んだんだけど、やっぱり理解できなかった。特に理解できないのは、A_j と E_{ti}[ A_j ]という記号の意味である。こういうことを書き留めると嗤われちゃうかもしれないけど、のちのちのために、現時点での混乱ぶりを正直にメモしておくことにする。
心のなかで有力な解釈は、いまのところこういうものだ。
ブランド j の品質を、N(\bar{A}_j, \sigma^2_A)に従う確率変数 A_j で表す。もちろん品質は消費者や使用状況に対して相対的に決まるものだが,その分布は個別具体的な使用経験からは独立に、アプリオリに決まっている。つまり、A_j は信念ではない。個別の使用経験におけるブランド j の知覚品質は、A_j にホワイトノイズ x_{ijk} が乗ったものである。つまりこのモデルでは、ブランド j の知覚品質は、ブランド j についての個々の消費者の信念とは無関係に決まっている。
消費者 i が時点 t において持っているブランド j の品質についての信念を確率変数 E_{ti}[ A_j ] で表す。ここで E というのは確率分布の平均を表す記号でなくて、A_jとは別の確率分布を表す記号なのだ(←え?)。t=0 におけるその分布は、なぜかA_j の分布に一致する(←えええ?)。著者は E_{0i}[A_j] = \bar{A}_j と書いているけど、これはなにかの間違いで、ほんとは E_{0i}[A_j]=A_j と書くべきだ。
信念を表す確率分布 E_{ti}[ A_j ] は、使用経験に伴って更新される。これを,A_j に z_{ijt}が乗った分布として捉えることができる。z_{ijt}の分散は時点とともに小さくなる。
。。。うーむ。かなりおかしい。この解釈だと、あらゆる使用経験の背後にある不変な品質が、時点0での信念に一致する、という奇妙な話になる。Eが期待値の記号じゃないというのも無理がある。
もうひとつの解釈はこうだ。
ブランド j の品質についての信念を確率変数で表す。その分布は個々の消費者の使用経験に従って更新されていく。それはほんとは A_{ijt} とでも書かないといけないんだけど、論文ではめんどくさいのでA_j と略記している (←まさか...)。個別の使用経験におけるブランド j の知覚品質は、そのときどきの信念 A_j (本来はA_{ijt}と書くべき) にノイズ x_{ijk} が乗ったものである。
t=0における A_j (本来はA_{j0}とでも書くべき)の分布はN(\bar{A}_j, \sigma^2_A)に従う。
消費者 i が時点 t において持っている信念 A_j (本来はA_{ijt}と書くべき)の分布の平均を E_{ti}[ A_j ] と表す。ここで E というのは、確率分布の(条件つきの)期待値を表す記号である。信念を表す確率分布 A_j (本来は A_{ijt} と書くべき)は、使用経験に伴って更新されていく。これを,初期分布 A_j (本来はA_{j0}とでも書くべき) が左右にz_{ijt}だけ動いた分布として捉えることができる。z_{ijt}の分散は時点とともに小さくなる。著者は E_{it}[ A_j ] = A_j + z_{ijt} と書いているけど、これはなにかの間違いで、ほんとは E_{it}[ A_j ] = \bar{A}_j + z_{ijt} と書くべきだ。
。。。うーむ。これもなんだかおかしい。話の筋は通るけど,まさかそんな変な書き方はしないだろう。
。。。私の手に負えない、あきらめよう。とにかく、話のポイントはこうだと思う。このモデルでは、消費者は各ブランドの知覚品質についての期待を時点ごとに更新していく。しかし、あるブランドの使用時の知覚品質が良かったときにそのブランドへの期待が上がるのではなく、あるナショナル・ブランドの使用時の知覚品質が良かったときにはすべてのナショナル・ブランドへの期待が上がり、あるストア・ブランドの使用時の知覚品質がよかったときにはすべてのストア・ブランドへの期待が上がる。
ここまでのところで疲れ切ってしまったので、あとは簡単に...
消費者 i にとっての時点 t でのブランド j の効用 U_{ijt} は知覚品質 X_{ijt} と価格P_{ijt} で決まると考え、
U_{ijt} = \alpha_i P_{ijt} + \omega_i X_{ijt} + \omega_0 \gamma_i X^2_{ijt} + \epsilon_{ijt}
と仮定する。係数は基本的にランダム係数で、正規分布を仮定。知覚品質をわざわざ二次にしているのは、リスク志向性の個人差を表現したいからである (\omega_0 \gamma_i が正だったらリスク志向的)。上の式から\epsilon_{ijt}を取り除いたやつをV_{ijt}として、消費者の選択をE[V_{ijt}]をつかった多項ロジットでモデル化する。
このモデルをいろんな国のスキャン・パネル・データに当てはめる。同定のための制約をいくつかつければsimulated MLで推定できるのだそうだ。カテゴリは、洗剤(米・英・スペイン)、トイレットペーパーとマーガリン(米・スペイン)。国xカテゴリごとに4~7ブランド、うちひとつがストア・ブランド。で、以下の指標を比較する。
- r_1: ストア・ブランドの\sigma^2_Aとナショナル・ブランドの\sigma^2_Aとの比 。事前のuncertaintyのちがいを表す。
- r_2: ストア・ブランドの\sigma^2_xとナショナル・ブランドの\sigma^2_xとの比。使用経験のなかに含まれている情報のちがいを表す。
- r_3: \gamma_i の平均と \alpha_i の平均の比。リスク回避と価格のどちらを重視するかを表す。
- r_4: \omega_iの平均と\alpha_iの平均の比。品質と価格のどちらを重視するかを表す。
- r_5: 知覚品質水準の最大値と最小値の差と、最大値との比。ストア・ブランドとナショナル・ブランドの品質の差を表す。
どの指標も、大きいときにストアブランドが不利になるはずの指標である。
その結果... どの国 x ブランドでも、消費者はリスク回避的。事前のuncertainty は0でない。どの5つの指標も、米・英・スペインの順に大きいのだが、r_1, r_2, r_3での差がすごく大きい。つまり、米のストア・ブランドは、品質について確信が持てず、使うたびに良かったり悪かったりするし、そもそも米の消費者は価格感受性に比べてリスク回避的だ、というわけだ。
あああ、疲れた。。。苦労して読んだ結果,何を得たのかよくわからないが,カルマン・フィルタについての知識が足りないことがわかったので,よしとしよう。
アメリカのストア・ブランドは、品質が低そうだという意味でエクイティが低いのではなく、むしろ品質がよくわからないという意味でエクイティが低いのだ,という知見が面白いと思った。実のところ、英のストアブランドは高品質路線、スペインのストアブランドは低品質路線なのだそうだ。とにかく整合的なポジショニングが大事なのであり、アメリカのストア・ブランドはそれができていない、ということらしい。たった数カテゴリの知見でなにを偉そうに,というツッコミは野暮というものであって,そんなことが購買データだけでわかるなんてすごいなあ,と素直に感心するのが正しい読み方であろう。
論文:マーケティング - 読了:Erdem, Zaho, & Valenzuela, A. (2004) アメリカでPBが売れない理由を購買データだけで突き止める
2012年4月25日 (水)
Andrews, R.L. & Currim, I.S. (2003) A comparison of segment retention criteria for finite mixture logit models. Journal of Marketing Research, 40(2), 235-243.
データ分類手法のひとつである有限混合モデル(潜在クラスモデル)では、モデル適合度指標をつかってクラス数を推定できるが、その指標のパフォーマンスを比較いたしました、という論文。類似の研究はいくつもあると思うのだが、この論文では、店舗スキャナ・データに多項ロジット選択モデルをあてはめ、顧客の選好の異質性を有限混合モデルで説明する、という状況に焦点を当てている。すごく狭い話ではあるが、そういうモデルを組む人にとっては大事な問題だ。
比較する指標は次の7つ。モデルの対数尤度をL, パラメータ数をkとして、
- AIC = -2L + 2k。
- AIC3 = -2L + 3k。Bozdoganという人が提案している由。なんで3になるのか、理屈はさっぱりわからないが、とにかく有限混合モデルでは3になるのだそうです。
- CAIC = -2L + k[(log n)+1]。nはサンプルサイズ。
- ICOMPという指標。AICみたいなもんだが、対数尤度に対するペナルティを、パラメータ数ではなく推定されたフィッシャー情報行列で決めるらしい。なんだかよくわからんが、パラメータ数が多すぎるモデルだけではなく、パラメータ推定の分散が大きすぎるモデルにもペナルティが課せられるのだそうだ。これもBozdoganという人が提案している由。
- SchwarzのBIC。
- 妥当化用サンプルでの対数尤度(LOGLV)。これが最大になるまでセグメント数を増やしていく。
- NECという指標。クラス数SのモデルのエントロピーをE(S)、対数尤度をL(S)としたとき、E(S)/(L(S)-L(1))だそうだ。クラス間の分離が大きいときに大きくなる理屈である。これが最大になるまでセグメント数を増やしていく。
シミュレーションは... 予測子は2値変数2つ、連続変数1つ(プロモーションと価格のつもり)。要因は、真のクラス数(2,3)、世帯レベル係数(クラス内でガンマ分布に従う)の平均のクラス間の差(3水準)、世帯数(100,300)、世帯当たり購入数平均(5,10)、選択肢数(3,6)、誤差分散(2水準)、最小のクラスのサイズ(3水準)。各組み合わせについて3個のデータセットを生成し、正しいセグメント数を復元できたかどうかを調べる。
その結果、総じてAIC3が優れていた由。へええー。
この論文を読んでいてふと思い出したのだが、ずっと前にフジテレビ制作の「ウゴウゴルーガ」という子ども向け番組があった。もう何年もテレビを見ない生活なのだが、ああいう面白い番組はいまあるのかしらん。あの番組のなかで、洋式便器の中のウンチがこちらに向かって、低いくぐもった声で文脈とは無関係なうんちくを垂れ、「~は~らしいぞ」と言い終わるか終わらないかのうちにザバーッと水流に流されていく、という非常にシュールなショートアニメがあったと思う。あれのスマフォ・アプリをつくったらちょっと面白いかもしれない。設定で「マーケティングデータ解析」を選択し、画面上のウンチをタップすると、「購買ログに有限混合多項ロジット選択モデルを適用するときは、AICにパラメータ数を足した値が最小になるクラス数を選ぶといいらしいぞ」ザバーッ、なんてね。
論文:データ解析(-2014) - 読了:Andrews & Currim (2003) 有限混合多項ロジット選択モデルのクラス数推定にはAIC3がいいらしいぞ (ザバーッ)
Revelle, W. (2009) Personality structure and measurement: The contributions of Raymond Cattell. British Jounral of Psychology, 100, 253-257.
なんで心理学の論文など読んでいるのかさっぱりわからないが、なんとなく目を通したもの。
この雑誌の100巻(つまり創刊100年)の記念号で、心理学史上に残る偉大な論文(Watson, Bartlett, Piaget, Cattell, Gibson)を採録し解説を付す、という企画があった模様で、これはCattellの1946年の論文"Personality structure and measurement"の解説として、キャッテル先生の偉業を短く振り返る記事。先日たまたま三相データについてちょっと調べていて、実は50年代のキャッテルの研究にすでに詳細な議論があるのだと知り、へええ、ずいぶん古くから話なんだなあ、と感心してるときにみつけた。著者についてはよく知らないが、Ortonyと共著があり、Rのpsychパッケージの開発にも関わっているようだ。
なんでも、1946年のこの論文においてすでにキャッテルはpersons, test, occsionsの3相からなる"data box"という概念を打ち出しているのだそうだ。66年にはこれにbackgroundとobserversを追加して5相に増やしている。78年に至るまで先生は理論の修正を続け、用語もどんどん変えておられる由。やーめーてー。
論文:データ解析(-2014) - 読了: Revelle (2009) 嗚呼Cattellは偉かった
2012年4月23日 (月)
シェイクスピア全集 (〔35〕) (白水Uブックス (35))
[a]
ウィリアム・シェイクスピア / 白水社 / 1983-01
近代人の常識を打ち破る荒唐無稽ぶりは,先日読んだ「シンベリン」に匹敵するのだけれど,こっちのほうが全然面白いと思った。舞台に「時」が登場してあれこれ説明するところなんか,典雅でよろしいですね。
重要な場面のひとつに,ボヘミアの海岸なる場所が出てくるんだけど(ボヘミアは現在のチェコ,内陸である),当時の観客にとっては違和感はなかったのだろうか,それとも,我々にとっての「信州の海辺」みたいなもので,あきらかにナンセンスだったのだろうか。
シェイクスピアの戯曲は小田島訳だと37冊あるが,うち21冊を読んでしまった。読むのがだんだんもったいなくなってきた...
成熟社会の経済学――長期不況をどう克服するか (岩波新書)
[a]
小野 善康 / 岩波書店 / 2012-01-21
新古典派もケインジアンも,生産力がありあまる成熟社会の経済をうまく捉えていない,という主旨の啓蒙書。著者は管政権のブレーンといわれた人。
経済の話はからっきし苦手なので,よく理解できたかどうか確信がないんだけど,経済学の考え方について学ぶところ大きかった。個人の実感を社会に拡大する,という風には考えないんですね。なるほどなあ。
ノンフィクション(2011-) - 読了:「成熟社会の経済学」
Andrews, R.L., Ainslie, A., & Currim, I.S. (2002) An empirical comparison of logit choice models with discrete versus continuous representations of heterogeneity. Journal of Marketing Research, 39(4), 479-487.
さっわやかなまでにテックニカルな論文。複雑な社会現象に正面から取り組むのも立派だけど、こういう話も気楽でよろしい。胸に一陣の風が吹き込むようだ。というか、どうでもいい話をテキトウな態度でフガフガと読むのは良い気晴らしになる。
えーと、この論文の掲載号に著者らはもう一本載せていて(Andrews, Ansari, & Currim, 2002)、メトリックなコンジョイント分析において有限混合モデルを使った場合と階層ベイズモデルを使った場合とを比較しているのだそうだ。個人パラメータの復元やホールドアウトの予測という観点からは、まあ似たようなもんである由。で、本論文はタイトルの通り、ロジット選択モデルについて同じことを調べます、という研究。今度はコンジョイント分析じゃなくて、ホーム・スキャン・パネル・データに選択モデルを当てはめる場合を想定してシミュレーションするわけだ。このバットで馬を殴り殺したから今度は鹿を殴り殺してみよう、というような話だ(←???)。いやー、いいなあー、この論文量産システム、すっばらしいなあー。
手続きの詳細はもう一本のほうの論文を読めとのことで、正確にはわからないのだが、推察するにこういうことだろう。次のような人工的な購買データをつくる。それは架空の(たとえば)400世帯の,世帯あたり(たとえば)15回の買い物データで,各世帯は各買い物において架空の5つのブランドのいずれかを購入する。各買い物において,それぞれのブランドは,価格,店内ディスプレイ有無,チラシ広告有無,の3つの値を持っている(ランダムに生成)。これら3つの変数の値と(重みは各データセットに対してランダムに付与),その世帯にとってのブランド部分効用の和によって,各ブランドの全体効用が決まり,選択も決まる。世帯は(たとえば)3つのクラスにわかれており,各クラスごとに,ブランド部分効用の分布が決まっている。というようなデータセットを,実験計画に従って生成しまくる。要因は,クラス数(1,2,3)、クラス間の分離の程度(2水準)、ブランドの部分効用の分布(正規分布,ガンマ分布)とその分散(2水準)、世帯数(75,200,400)、世帯当たり購買数(3,10,15)、誤差分散(2水準)。すべての組み合わせ(360)についてひとつづつデータセットをつくり,それに有限混合ロジットモデル(FM),ならびに階層ベイズ推定した混合ロジットモデル(HB)を当てはめる。ここでいうFMモデルとは、世帯パラメータの分散がクラス内で0であるモデルのことで(クラス数はBICとかで推測する)、つまりFMでは世帯間異質性を離散的に捉え、HBでは連続的に捉えていることになる。で、成績指標として、世帯パラメータのRMSE、モデルの適合度(対数尤度, BIC)、ホールドアウトでの対数尤度とブランド選択率予測値を求め、データセットごとの成績をANOVAで分析する。
結果は適当に飛ばし読みしてしまったが、ひとことでいえば、世帯当たり購入数3の条件ではHBはボロボロ。うーむ、消費者あたりのデータが少なくてもHB推定はできちゃうけど、あんましあてにならない、ってことですね。反省。いっぽう、購入数が増えればFMもHBも大差ない由。
論文末尾で著者らいわく、「分析者が消費者異質性を連続的に表現するモデルを好むか離散的に表現するモデルを好むかは、その人の意見と個人的好みの問題だが、主観的な議論と思索よりは実証的証拠のようが説得的だから、さらなる実証研究がなされるといいなあと思う」とのこと。ふーん。
論文:データ解析(-2014) - 読了: Andrews, Ainslie, & Currim (2002) 有限混合モデル vs. 階層ベイズモデル ~選択データ分析での対決~
2012年4月21日 (土)
van Heerde, H.J., Gupta, S., Wittink, D.R. (2003) Is 75% of the sales promotion bump due to brand switching? No, only 33% is. Journal of Marketing Research, 40(4), 481-491.
ええと、話の発端としては... ブランドの売上の弾力性は、カテゴリ購入の弾力性、ブランド選択の弾力性、購入数量の弾力性、の3つに分解できる。
ある世帯である機会にカテゴリ購入が生じる確率を $P(I)$, カテゴリ購入が生じた場合のブランド$j$の選択確率を $P(C_j | I)$, ブランド$j$の購入が生じた場合の購入数量を $Q_j$とする。ブランド$j$の売上数量$S_j$はこの3つの積になる。すなわち
$S_j = P(I) P(C_j | I) Q_j$
価格弾力性について考えよう。ある購入時点でのブランド$j$の価格と、ブランド$j$の標準価格との比を$D_j$とする。売上数量の価格弾力性は、-(売上の変化率/価格の変化率)、書き換えると-(もとの価格水準/もとの売上水準)(売上の変化量/価格の変化量)である。これを偏微分で表して
$\displaystyle \eta_{S_j} = \frac{\partial S_j}{\partial D_j} \frac{D_j}{S_j}$
このS_j にさっきの式を代入して下式が得られる:
$\eta_{S_j} = \eta_{I_j} + \eta_{C_j} + \eta_{Q_j}$
右辺の3つの項はそれぞれ、ブランド$j$の価格に対する、カテゴリ購入の弾力性、ブランド選択確率の弾力性、購入数量の弾力性である。おお、分解できている。このうちカテゴリ購入と売上数量を一次需要効果、ブランド選択を二次需要効果という。
Gupta(1988, JMR)という研究がプロモーションの効果にこの分解を当てはめ、以来たくさんの研究者がいろんなカテゴリについてこの分解を試みている由。コーヒーでは14:84:2だとか(Gupta, 1988)、ヨーグルトでは15:40:45だとか(Chintagunta, 1993)。概してブランド選択確率の弾力性が占める割合が大きいといわれている。
問題はこの割合をどう解釈するかである。たとえばGupta(1988)はこういっているのだそうだ:「プロモーションが引き起こした売上増のうち、84%以上がブランド・スイッチングに由来している」。著者らは先行研究での文言を一覧表にしているのだが(暇だねえ)、多くの研究者が、この割合を売上数量に占める割合と解釈している。プロモーションによって売上が100個増えたとして、そのうち84個が他ブランドからのスイッチだ、という解釈である。
この解釈は間違っています、というのがこの論文の主旨。やれやれ、疲れた。
どこが間違っているかというと、プロモーションによってブランド売上だけでなくカテゴリ売上も増えるからである。著者らの説明は以下の通り。
各週に購入機会が1000回生じ、カテゴリ購入率が20%、購入が生じた場合の購入数量は1個、購入が生じた場合のあるブランドの選択確率が18%だとする。ある週のカテゴリ売上は1000*20%=200個、うち当該ブランドの売上は200*18%=36個である。
いま、ブランド売上の弾力性が0.248のブランド・プロモーションを行う。その弾力性が14:84:2に分解できるとしよう。つまり、カテゴリ購入0.034、ブランド選択0.210、購入数量0.004である。
プロモーションの結果、ブランドの売上は1.248 * 36 = 45.2個となり、9.2個増える。さて、この9.2個はどこから来たか?
まず、ブランド選択確率は1.210 * 18% = 21.8%であり、もとの200個のうち当該ブランドの売上は200*21.8%=43.6個である。他ブランドから7.6個奪ったわけだ。これは増加した9.2個のうち83%にあたり、弾力性の分解と対応している。
ところが問題は、カテゴリの売上も増えているという点である。カテゴリ購入率は1.034*20%=20.7%、カテゴリ売上は1000*20.7%=207個、つまり7個増えているのだ。この7個のうち、7 * (100%-21.8%) = 5.4 個は他ブランドに流れる。他ブランドの立場に立つと、7.6個減って5.4個増え、差し引き2.2個の減少である。つまり、当該ブランドの増加9.2個のうち、他ブランドからのスイッチは、84%どころか、たったの2.2/9.2=24.3%だったことになる。
というわけで、著者らは(売上の弾力性ではなく)売上数量の変化を分解する方法を提案し、実データ(世帯パネルデータ)への適用例を示している。面倒なので飛ばし読み。実務的な示唆としては、販売プロモーションの効果に占めるブランド・スイッチングは、売上数量ベースで考えるなら、いままで思っていたよりずーっと小さかった、という話である。
どういう事情だったのかさっぱり忘れちゃったけど、この論文、前に仕事の都合で「お前らこれを読め」と回覧されてきて、しかしいざ他人に読めと言われると面倒くさくなってしまい、結局読まずじまいだった奴だ。その節はどうもすいませんでした。
論文:マーケティング - 読了:van Heerde, Gupta, & Wittink (2003) 販促の効果に占めるスイッチングは君が思うよりずっと小さい
2012年4月20日 (金)
仏教とは何か―ブッダ誕生から現代宗教まで (中公新書)
[a]
山折 哲雄 / 中央公論社 / 1993-05
偉い先生による,「私が思うに仏教とはこういうものである,その根拠は私がそう思うということである」というタイプの本だった。
物語イタリアの歴史―解体から統一まで (中公新書)
[a]
藤沢 道郎 / 中央公論社 / 1991-10
物語 イタリアの歴史〈2〉皇帝ハドリアヌスから画家カラヴァッジョまで (中公新書)
[a]
藤沢 道郎 / 中央公論新社 / 2004-11
マキャベリのフィレンツェ史を読み始めて,予備知識が足りないことに気づいて中断し,お手軽そうな入門本を適当に買って読み始めたのだが,これが意外にも含蓄深い内容であった。ただの読み物ではない,人物伝のかたちをとった歴史書である。
電機・最終戦争―生き残りへの選択
[a]
/ 日本経済新聞出版社 / 2012-01-25
ノンフィクション(2011-) - 読了:「電機・最終戦争」「物語イタリアの歴史」「物語イタリアの歴史II」
花のズボラ飯(2)
[a]
久住昌之,水沢悦子 / 秋田書店 / 2012-03-08
昨年評判になったB級グルメマンガ,第2巻。水沢悦子という謎の新人マンガ家の絵柄が,18禁マンガ誌出身の作家「うさくん」の絵柄とうりふたつであるという点については,なにも言わないお約束になっているそうなので,なにも言うまい。
連載を続けるとすると,いずれはドラマ要素を入れないといけないだろうなあ,と思っていたのだが,本巻では親友のメガネ・レディがその役回りを果たしている。そうきたか。
なのはな (フラワーコミックススペシャル)
[a]
萩尾 望都 / 小学館 / 2012-03-07
震災と原発事故を踏まえた,寓話的な作品集。
コミックス(2011-) - 読了:「なのはな」「花のズボラ飯」
Cartwright, N. (2011) A philosopher's view of the long road from RCTs to effectiveness. Lancet, 377, 1400-1401.
著者はイギリスの哲学者で、いま調べたら著書の邦訳はないようだけど、たしか有名な人だと思う。この人がある論文集に、"Predicting 'It will work for us': Way beyond statistics" というすごく面白そうなタイトルの論文を寄せていて、それを読み始めたのだが、数ページでさっぱりわけがわからなくなってしまった。単にあきらめるだけだと気分が悪いので、代わりにこの人がランセットに寄せた短いコメントを読んでお茶を濁す次第。ところが、医学者向けに平易に書かれたこの文章でさえ難しくて、長々とメモをとってしまった。
因果的主張に際してランダム化統制試験(RCTs)が優れているといわれる、その理由はなにか? 根本的な理由が二つある。(1)理想的なRCTsは因果的な結論の決め手になる[clinch] ことができるから。(2)理想的なRCTsはself-validatingだから。
まずひとつめについて:
手法のなかには、結論に対して単に証拠を提供する[vouch for]だけのものもある。ある知見が仮説に証拠を提供しているとみなされるためにはなにが必要かを正確に述べるのは難しいが[althogh it is problematic to say exactly what it takes for a finding to vouch for a hypothesis]、一般的にいえば、少なくとも、その仮説なしにはその知見は驚くべきものであり、その仮説の下ではその仮説は驚くべきものではない、ということが必要だろう。また手法のなかには、[証拠を提供するだけでなく、] 理想的には[in the ideal] その結論の決め手になる [clinch] ものもある。つまり、もしその手法を定義している諸想定が満たされているならば、肯定的な結果がその結論を演繹的に含意するような手法である。理想的なRCT(すなわち、必要な前提がすべて満たされているRCT)は、ひとつの決め手[a clincher]である。大まかにいえば、RCTの論理はある一般的な形而上的前提を想定している: 確率的依存性は因果的説明を要求する[calls for]という前提である(前提1)。実験デザインはもうひとつの前提を保証する働きをする: アウトカムに因果的に関連している、処理(そしてその下流にある諸効果)以外のすべての特徴が、処理群と統制群の間で同じ分布をしているという前提である(前提2)。そして、もしそのアウトカムが統制群よりも処理群においてよりprobableであるならば(前提3)、可能な唯一の説明は、処理群のなかの幾人かのメンバーにおいてその処理がアウトカムを引き起こした、という説明である。
EBMは、さまざまなvouching evidencesではなくclinchersに焦点をあてるという性質を持っている。おそらくはvouching evidenceを扱うためのチェックリストがないからだろう。しかし、clincherはRCTだけではない。ケース・コントロール研究のような非実験的データや確立した理論からの演繹もclincherになれる。RCTが他とちがうのは、2つめの特徴、つまりself-validatingであるという特徴である。
いかなる手法も、そこからの結論を担保[warrant]するためにあらかじめ満たす必要がある諸想定を持っている。[...] RCTのデザインには、形而上的想定[前提1のことであろう]は別にして、前提2と3を支持[support]してくれるもの(保証[guarantee]してくれるものではない)が組み込まれている[built right into]。処理の施行の監視、ブラインド化、無作為割付、などなどが前提2を支持し、観察された頻度から確率を推論するための技法(たとえば標本サイズが大きいこととか)が前提3を支持する。このように、RCTsはself-validatingである。
self-validationは美徳ではあるが、しかし必須ではない。RCT以外の研究デザインであっても、十分な情報があれば因果的結論を支持できる。
さて、ここからが本題である。ここまでの話はすべて、「処理群のなかの幾人かのメンバーにおいてその処理がアウトカムを引き起こした」という因果的主張、つまり"it-works-somewhere"という主張を支持することについての話だ。いっぽう我々が求めているのは、処理が我々の状況において望ましいアウトカムを引き起こすという因果的主張、つまり"it-will-work-for-us"という主張を支持することだ。著者はこの主張を"efficacy claim"と呼んでいる。
it-works-somewhereからit-will-work-for-usを引き出すために必要なのは、「その処理がそのアウトカムをreliably promoteしている」という主張である。ここで"reliably promote"というのは、大まかにいって、「さまざまな環境を通じて、処理が存在しないときよりも存在するときのほうがそのアウトカムがたくさん生じる」ということである。著者はこの主張を"capacity claim"と呼んでいる。
ところが問題は、"it-works-somewhere"と"reliably promote"(capacity claim)だけから"it-will-work-for-us"(effecacy claim)を引き出せないという点である。なぜなら、我々はさらに、我々の状況が必要なhelping factorsをすべて含んでいるということを知っていないといけないし、逆方向の圧倒的な原因がないということを知っていないといけない。さらに、capacity claimを担保するのは難しいし、なにが担保になるかを述べてくれる方法論もない。capacity claimを支持してくれるのは、結局は、処理がアウトカムを生み出す理由についての一般的な理解である。
というわけで、RCTが支持してくれるのは"it-works-somewhere"であって、そこから"it-will-work-for-us"を引き出すためには、capacity claimを理論的に担保するというmessyな問題に取り組まなければならないということを心に刻みなさい。云々。
やれやれ。苦労して読んだわりには、いまいち話のポイントがつかめなかった。この文章を読む限り、著者のいうcapacity claimというのはいわゆる外的妥当性のことだろうと思うのだが、先に読みかけて挫折した論文のabstractには、'external validty' is the wrong way to characterize the problem なあんて書いてある。なんでだろう。
論文:データ解析(-2014) - 読了:Cartwright (2011) 「こうなってる」から「こうするといいよ」への長い道
Pauwels, K., Hanssens, D.M., Siddarth, S. (2002) The long-term effects of price promotions on category incidence, brand choice, and purchase quantity. Journal of Marketing Research, 39(4), 421-439.
価格プロモーション(要するに値引きのことですね)の影響を、{カテゴリ購入、ブランド選択、購入数量}における{即時的、調整的、永続的}効果に分類し、この3x3=9マスの全てについてひとつの枠組みで検討いたします、という論文。ここで調整的効果というのは、値引き実施時に生じた変化が、値引き終了後に元のレベルに戻ったり、新しいレベルに落ち着いたりするまでに生じる効果を指している。従来のモデルではこの調整的効果と永続的効果を区別できていなかった由。
値引きが即時的には売上にポジティブな効果をもたらすのはいいとして、調整的効果・永続的効果について考えると、著者らいわく、その背後にありそうなメカニズムは山ほどある。
- 消費者の動的反応。さらに以下のように分けられる。
- postdeal trough。値引きによって購入が早くなったり購入量が増えたりすると、自宅に買い置きができるわけで、直後の売上は落ちる。(ネガティブ)
- 単純購入効果。
- 値引きでトライアルを促進したせいでリピート購入が増える。(ポジティブ)
- 離れていたお客さんが値引きで呼び戻される。(ポジティブ)
- 値引きのせいでまとめ買いしたせいで消費速度が速くなり、値引き後も元に戻らない。(ポジティブ)
- 知覚の変化。
- 自己知覚理論によれば、値引き時の購入者は「自分はブランドが好きだから買ったんじゃなくて値引きのせいで買ったんだ」とみなすはずである。(ネガティブ)
- 値引きのせいでそのブランドの内的参照価格が下がる。(ネガティブ)
- Blattberg et al.(1999)のobject perception theory によれば(←なんのことかわからないか、ある種の帰属理論ではないかと思う)、値引きのせいでブランドの品質イメージが低下する。(ネガティブ)
- 競合の反応。競合が対抗して値引きしたら、ブランド選択は減少するが(ネガティブ)、カテゴリ購入頻度はさらに増大するだろう(ポジティブ)。
- パフォーマンス・フィードバック。値下げ販促が成功したとみなされると、それはきっと繰り返される。そのせいで販促の効果はより積み上がるかもしれないし(ポジティブ)、消費者側が慣れちゃって効果が下がるかもしれない(ネガティブ)。
以上に基づき、著者らは値下げの調整的効果はカテゴリ購入についてポジティブ、ブランド選択についてネガティブだと予測している。うーん、前者のロジックがいまいちわからない。ポジティブなメカニズムもネガティブなメカニズムも想定できるし、どちらが勝つかわからないと思うんだけど。
そんなこんなで、著者らは仮説として次の10個を挙げている:
- 即時的効果はポジティブであり、カテゴリ購入・購入数量よりもブランド選択において大きい。(Bell et al., 1999 Marketing Sci. による)
- 調整的効果は、カテゴリ購入についてはポジティブ、ブランド選択においてはネガティブである。(←上述の理屈による)
- 永続的効果は存在しない。(←えーっ、つまんないの)
- 全部合わせた効果は、カテゴリ購入・ブランド選択・購入数量の全てにおいてポジティブだ。
- 全部合わせた効果は、カテゴリ購入において一番大きい。
- 買い置き可能な製品では、全部合わせた効果はブランド選択においてよりも購入数量において大きい。
- 買い置き不能な製品では、全部合わせた効果は購入数量においてよりもブランド選択において大きい。
- 全部合わせた効果は、購入数量においては買い置き不能な製品よりも買い置き可能な製品のほうで大きく、カテゴリ購入・ブランド選択においては差がない。
- カテゴリ購入・ブランド選択・購入数量のいずれにおいても、効果は四半期(13週)以内に消える。(←永続的でないという主旨)
- 調整的効果の期間は買い置き可能な製品において長い。
Journal of Marketing ResearchやJournal of Consumer Researchの論文や、マーケティング系の消費者行動研究の発表を聞いていて、何度か不思議に思ったことがあるのだが、この分野の研究者の方は、なぜか執拗なまでに仮説検証型研究の論述スタイルに従い、仮説H1, H2, ...をインデントしてリストアップしたがる傾向があるように思う。よくよく読むと、仮説を導出するロジックがあいまいだったり、仮説そのものが定性的だったりして(まさにこの論文がそうだ)、むしろ作業仮説を踏まえた探索研究という感じなのだから、H1, H2だなんて堅苦しい書き方をしなくてもいいんじゃないかと思うのだが。こういう書き方については、心理学の基礎研究のほうがかえって自由であるように思う。もしかすると、消費者行動研究のほうがrigidな方法論から遠い(と思われてんじゃないかしらと研究者が気にしている)ぶんだけ、スタイルにはこだわる、というような歴史的いきさつがあるのかもしれない。
それはまあどうでもいいや。問題は分析手続きである。バリバリの経済時系列分析。苦手分野なので、読み通すのが大変だった。
ホーム・スキャン・データを使っているにも関わらず、世帯レベルではなく店舗レベルの時系列データを分析している。2年3ヶ月間のデータを用い、スープ缶(買い置き可能)とヨーグルト(買い置き不能)の購買記録を、店舗xブランド別に集計する。スープ缶について4店舗(各店舗について3ブランド、延べ12ブランド)、ヨーグルトについて3店舗(各店舗について5~6ブランド、延べ17ブランド)に注目し、週ごとに、カテゴリ購入者数、ブランド選択率(指標としてシェア/(1-シェア)を使っている)、購入者あたり平均購入数量を算出する。えーと、全部で29x3本の多変量時系列だ。
分析を3つのステップに分ける。ステップ1では、個々の時系列について、それが定常かどうかを片っ端から単位根検定(ADF検定)で検討する。いくつか有意にならなかった時系列があるのだが、個々にケチをつけて分析から除外し、すべて定常ですと結論する(仮説3を支持)。なお価格の時系列も、缶スープはトレンド定常、ヨーグルトは(新製品参入による影響をダミー変数で説明すれば)定常だったそうだ。
ステップ2では、カテゴリx店舗xブランド別に二次のベクトル自己回帰(VAR)モデルを構築する。たとえばスープ缶、店舗1、ブランド1については、{カテゴリ購入者数、ブランド1選択率、ブランド1購入数量、ブランド1価格、ブランド2価格、ブランド3価格} の6つが内生変数、各ブランドのfeature有無とdisplay有無(なんて訳せばいいんだろう)が外生変数。価格を内生変数にしているのにはびっくりしたが、競合の反応やパフォーマンス・フィードバックをモデルにいれようとしているわけだ。
ステップ3では、構築したVARモデルから、当該ブランドの価格をいきなり1SDだけ下げたときになにが起きるかを表すインパルス反応関数を導出する。ここの手順は難しくて理解できなかった。えーと、その結果、即時的効果は3つの指標ですべてポジティブ、弾力性はブランド選択でもっとも高かった(仮説1を支持)。調整的効果はだいたい2週間くらい続き(仮説9を支持)、購入数量における効果はスープ缶で長かった(仮説10を支持)。弾力性はカテゴリ購入についてはポジティブ、ブランド選択についてはネガティブ(仮説2を支持)。即時的効果と調整的効果を合計すると、どの指標でもだいたいポジティブで(仮説4を支持)、3つの指標における弾力性を比に直すとスープでは66:11:23、ヨーグルトでは58:39:3 (仮説5,6,7を支持)。スープ缶のほうが購入数量の弾力性が高かった(仮説8を支持)。云々。
ご丁寧にも、同じデータに世帯レベルのモデルを当てはめ、推定された弾力性を比較したりしている。面倒なので省略。
上記のメモは全部読み通してからまとめたのだが、論文は手法と結果をこれまたrigidに分けて説明していて、手法のところには「もし時系列が定常でなかったら共和分分析で長期均衡が存在するかどうか調べなきゃ」とか「その際にはVARモデルではなくベクトル誤差修正モデルを構築しなきゃ」とか、エライ難しそうな話が書き連ねてあり、肝が冷えた。結果として定常だったから、結局VARモデルしか使っていないのだが。あー、怖かった、脅かさないでほしい。
ともあれ、時系列データの分析手法について、とても勉強になった。しかし冷静になってみると、要するにこの論文は「ある店舗のあるブランドの売上の時系列は長期的には平均に収束する性質を持っていました、ゆえに、価格プロモーションには永続的効果がないものと思われます」と主張しているわけだ。ケチをつけるわけじゃないけど、ブランド価値を棄損しちゃったり内的参照価格を変えちゃったり競合を巻き込んじゃうような破壊的な値引きが、たまたまこの観察データ内になかった、ということに過ぎないのかもしれないですね。さらにシニカルにいえば、価格プロモーションの効果が総体としてポジティブであるという知見も、価格プロモーション自体の性質というより、観察した店舗とブランドに関して、関係者が価格プロモーションを上手く使ってた、という話かもしれない。著者らはマネジリアルな示唆として「実務家のみなさん、価格プロモーションも悪くないっすよ」と述べているのだが、あんまり真に受けるのもどうかと思った。
論文:マーケティング - 読了:Pauwels, Hanssens, & Siddarth (2002) 値引きの長期的功罪
2012年4月12日 (木)
Dillon, W.R., Frederick, D.G., Tangpanichdee, V. (1985) Decision issues in building perceptual product spaces with multi-attribute rating data. Journal of Consumer Research, 12(1), 47-63.
消費者調査の分野でよく登場する,製品ないしブランドの知覚マップのつくりかたについての解説。製品の多属性評価データに基づくマッピングを前提に,データ入力,データの相(mode),事前処理,選好のモデル化,技法,解,の6つの段階に分けて,問題と注意点を列挙している。
仕事の足しになるかと思って読んだ。なにぶんにも20年近く前の論文なので,いささかout of dateなところもあるのだが,こういうレビューは頭の整理になるような気がする。
列挙されている注意点をメモしておくと:
- 属性選択に関して:
- 双極尺度や同意度尺度では,属性の値が連続体上に落ちるという暗黙の想定がなされているが,これは必ずしも正しくない。
- 因子分析のようなデータ縮約指標で手に入れた軸は,消費者がどんな特徴を大事だと思っているかではなく,単に属性セットによって決まっている。
- アクショナブルな製品空間を得ようとしているなら(常にそうとは限らないが),属性はマーケティング・マネージャーが制御できる事柄に変換できないと困る。
- 製品空間で製品選好を説明するためには,選好が属性の関数なのか軸の関数なのかが問題になる。前者の場合,"attributes must be scaled so that they will load on the reduced space dimensions in the same way that they influence preference judgments."
- データ配列に関して:
- データとして対象者x製品x属性の3相データが用いられることが多いが,他の相を導入してもよい。製品使用の文脈とか。
- データ入力に関して:
- 相関行列ではなくローデータ行列を入力したほうがいい場合もある,注意せよ(←うーむ,なんだか昔のはなしですね...)
- データの相が空間に与える効果に関して:
- 製品 x 属性の集計表の分析は,知覚過程における個人差を無視している点に注意。
- 属性間相関には製品間の平均・SDの差異が複雑な影響を及ぼしていることに注意。
- 因子分析の場合,ふつうは属性のみが因子に負荷を持ち,製品は因子得点に基づいて布置されている。理想的には,属性における因子と製品における因子の同時分析が望ましい。
- 慣用的に用いられている2相分析よりも(←ここでは,製品と属性の同時布置のことであろう),製品と対象者の同時布置や,対象者・製品・属性の同時布置のほうがよいかもしれない。
- データの累積(aggregation)に関して:
- 対象者ごとの製品 x 属性データを縦積みしてつくった行列(extended data matrix) を分析するアプローチはよくない。なぜなら,属性間の相関が,(1)属性間の整合性と対象者間異質性の両方を反映するから。(2)外れた製品や外れた対象者によって影響されるから。
- 2相因子分析モデルにおける前処理に関して:
- 良く用いられる前処理には,normalization(列ベクトルの二乗和が1になるようにすること), standardization, centering, ipsative scaling(行=個人内の合計を一定にすること), bounding, null scaling(期待値からの差を取ること)があるが...(以下,因子分析に絞ってごちゃごちゃ書いてある。省略)
- 3相データの前処理に関して: (面倒なので省略)
- 製品の知覚空間のための前処理に関して:
- 良く用いられる前処理には,個人xブランド別のstandardization, 項目別のstandardization, 個人x項目別のnormalizationがあるが...(以下,extended data matrixの因子分析についてごちゃごちゃ書いてある。省略)
- 選択・選好のモデリングに関して:
- 理想点モデルとベクトル・モデルがある。なにかの属性で極端に高い/低いブランドがある場合は前者が,ない場合は後者がうまくいく。この二つを属性によって使い分けるモデル(Shocker & Srinivasan, 1974, 1979)もある。
- 知覚空間においては表現されていない属性が,選好とは密接に関連している,という場合もありうる。
- 手法に関して:
- 2相の手法には,因子分析(FA),主成分分析(PCA),ratio MDS, 重判別分析(MDA)がある。PCAで項目x項目の共分散行列から製品空間をつくっても,RMDSで製品x製品のユークリッド距離行列から製品空間をつくっても,同じことである。いっぽうMDAは製品間分散が大きい属性を重視するので,ある意味でよりactionableである。云々。
- 3相の手法には,CANDECOMP, INDSCAL, PARAFAC, TUCKER3のような成分モデルと,共分散構造モデルがある。前者は3相をすべてを固定的に扱い,後者はひとつの相(ふつうはヒト)を確率的に扱う。前者はより探索的,後者はより確認的である。製品空間という観点からは前者に関心が持たれる。云々。
- 軸の方向に関して:
- FA, PCA, MDAでは(たとえば単純構造を目指して)回転が行われることが多い。Thurstoneはそんなのどうでもいいよと言っているが,それはデータの記述を目的としている場合の話であり,いっぽう製品空間をつくる目的は"to obtain novel information on the latent, but empirically real, processes that generatethe observed relationships"なのだから(←そ,そうかなあ...),回転はすごく大事だ。解が一意に決まるという点ではPCAが良いが,第一軸がいろんな要因の合成になっちゃうし,その軸でなぜある製品が高いのかわかんないので不便だ。云々。
- 得られた軸の確認に関して:
- PCAやFAの解は再現できても妥当とはいえない。いっぽうintrinsicな解(PARAFACなどのことらしい)は再現性が妥当性の証拠になる。
製品開発やブランドに関わるサーヴェイ調査データは,ヒト x モノ(製品ないしブランド) x コト(属性)の3相データになることが多い。測定値は立方体の形に並ぶわけだ。仕事の関係で調査データの分析レポートを目にする機会があると,ついつい「この業者さんは3相データをどう処理しているかな...」とチェックしてしまうんだけど,対象者xモノを行,項目を列にとった縦積みのローデータを因子分析して,因子得点で重回帰して... っていうの,非常に多いですね。Srinivasanらのいうtotal analysis, この論文でいう extended data matrixアプローチである。
それがまずいという指摘はこの論文に限らず時々見かけるし,仕事のなかで頻繁に議論になる問題である(月に一回くらいの頻度でこの話を誰かに説明しているような気がする)。以前,説明の際のネタにしようと思い,このアプローチを採用している(いわば悪役の)実証研究を探してみたことがあるのだが,うまくみつけられなかった。この論文では,Hauser & Koppelman (1979, JMR), Huber & Holbrook(1979, JMR)が挙げられているけど,うーん,もっと新しいのはないかしらん。
ところで... 以前,社内研修で3相データの扱いについて話す際,この立方体になんかステキな愛称がつけらんないもんかしらんと首を捻ったことがあったのだが(そういうくだらないことばかり考えているからいけないのかもしれない),この論文によれば,なんと! すでに50年代に,R. CattellがこれをBDRM(Basic Data Reduction Matrix) と呼んでいるのだそうだ。し・ら・な・か・っ・た! 70年前後にCattellが多相データについて論じる際,"Data Box"という言い回しを使っているのは見かけていたのだが。。。
Cattellは知能研究の話には必ず出てくるビッグ・ネームで,私も心理学の講義をやっていた時分には,あたかもその研究について知悉しているかのように紹介していたものだが,恥ずかしながら通り一遍の知識しかなく,院生のころに聞いた先輩の「キャッテル先生,ペット飼ってますか?」「うんキャッテル」という冗談だけが妙に印象に残っている。ごめんなさいごめんなさい。
それにしても,Cattellの名前にこんなに動揺したのが,我ながら可笑しい。仕事がらみの資料をフガフガと気楽に読んでいて,いきなり心理学者の名前が出てくると,ある町を散歩していたら不意に別の町に着いたような気がするのである。
論文:マーケティング - 読了:Dillon et al. (1985) 製品マップのつくりかた
2012年4月11日 (水)
鮫島の貌 新宿鮫短編集
[a]
大沢在昌 / 光文社 / 2012-01-18
新宿鮫シリーズの短編集。ファン向けの内容であった。
クワイン―ホーリズムの哲学 (平凡社ライブラリー)
[a]
丹治 信春 / 平凡社 / 2009-10
関係者の頭の良さだけでいえば,哲学こそが人文系諸学における最高峰,F1みたいなものだと思う。大学院の頃を思い出しても,哲学科の院生たちときたら,ほとんど化け物のようであった。分析哲学の世界的な研究者である丹治先生などは,さしずめセナだかシューマッハだかに相当するといえよう。そのF1レーサーが初心者向けに書いた,クワインの入門書。
こんなに平易なことばで,こんなにヤヤコシイ話を語ることができるのか... と,変な風に感銘を受けた。中身が完全に解ったとは言い難いのだが,とても楽しい読書であった。
いつも思うのだけれど,分析哲学の本を読んでいると,時折奇妙なユーモアのようなものを感じる。この本でいうと,たとえば指示の不可測性についての議論のなかで,日本語の「牛」は実は一般名辞ではなく物質名辞じゃないか(「一杯のミルク」というのと「一頭の牛」というのは同じなんじゃないか) という奇妙な説を紹介するくだり。この説における「牛」とは「生きた牛肉」として扱われることになる... と述べた上で,いや「一頭の死んだ牛」という言い方もできるから,正確には「生きていたり死んでいたりする牛肉」というほうがよいだろう,とわざわざ注釈をつけておられる。こういうところで,つい吹き出してしまうのである。
般若心経・金剛般若経 (岩波文庫)
[a]
/ 岩波書店 / 1960-07-25
哲学・思想(2011-) - 読了:「クワイン」「般若心経・金剛般若経」
プロメテウスの罠: 明かされなかった福島原発事故の真実
[a]
朝日新聞特別報道部 / 学研パブリッシング / 2012-02-28
影の銀行―もう一つの戦後日本金融史 (中公新書)
[a]
河村 健吉 / 中央公論新社 / 2010-08
9割5分がた,理解不能であった。著者の責任ではなく,私が金融の話に皆目ついていけないということにすぎない。
ノンフィクション(2011-) - 読了:「プロメテウスの罠」「影の銀行」
ジジゴク(1) (アクションコミックス)
[a]
沖田 次雄 / 双葉社 / 2012-03-28
いつもジャージ姿の高齢ヤクザを主人公にしたコメディ。「インシュリンの代わりにシャブ」「血糖値賭博」「寝たきりの占有屋」などなど,いかにも思いつきそうなアイデアではあるが,面白い。
木曜日のフルット 2 (少年チャンピオン・コミックス)
[a]
石黒 正数 / 秋田書店 / 2012-04-06
高校球児 ザワさん 9 (BIG SPIRITS COMICS SPECIAL)
[a]
三島 衛里子 / 小学館 / 2012-03-30
ヒル 1 (BUNCH COMICS)
[a]
今井 大輔 / 新潮社 / 2011-09-09
サウダーデ(2) (KCデラックス Kiss)
[a]
池辺 葵 / 講談社 / 2012-03-13
進撃の巨人(7) (講談社コミックス)
[a]
諫山 創 / 講談社 / 2012-04-09
コミックス(2011-) - 読了:「木曜日のフルット」「高校球児ザワさん」「ヒル」「サウダーデ」「進撃の巨人」「ジジゴク」
2012年4月 9日 (月)
von Davier, M., Gonzalez, E., & Mislevy, R.J. (2009) What are plausible values and why are they useful? IERI Monograph, 2, 9-36.
たまには目の前の仕事と無関係な話を読みたくなり目を通した。 いますぐに関係ないとはいえ、このさき役に立ちそうな気もするし。
PISAやTIMSSといった大規模教育測定の話のなかでときどき見かける、plausible value (PV)という概念についての解説。なんて訳せばいいのかわからないが、いまwebで調べたら「推算値」と訳している人がいた。
IERIというのはアメリカのETSと、アムステルダムのIEA (Int. assoc. for the Evaluation of Educational Achievement)というところが共同でやってる組織らしい。第1, 第2著者はETSの人。三人目のMislevyという人がこの概念の主唱者だと思う。
すごくわかりやすい説明であった。PVってのは要するに、項目反応理論でいうところの潜在特性 Θ の事後分布を個人ごとに推定し、そこからランダム・ドローした値のことらしい。個人の分析ではなく集団特性の分析に用いるもので、ランダム・ドローした値の平均や分散は、Θの点推定値の平均や分散とはちがって不偏推定量となる。ふつうはこれを5セット繰り返し集計値を併合して精度を上げる由。なお、複数回ランダム・ドローした値の個人別平均値を使うのは誤り。
なあんだ、こないだ調べた潜在クラスモデルにおけるpseudo-class drawとそっくりな話ではないか。もっとエキゾチックな話題かと思ってた、意外なり。
いまやってる市場調査関連の仕事に当てはめて考えると、たとえばwebでのサーベイ調査で、ある事柄への態度をあれやこれや調べて集団レベルで比較したい、ほんとは100項目くらい調べて因子分析でもしたいんだけど、回答負荷の観点から泣く泣く項目を減らしましょう、などという場合がある。別に個々人に全部答えてもらう必要はないじゃん、PISAみたいに項目をブロックにわけてブックレットをつくってもいいし、なんならランダムに項目を出したっていいじゃん... と思うのだが、これがなかなか受け入れてもらえない。まあ、全国学力テストでさえ全員に同じ項目を与えてしまうお国柄だから、しょうがないかなと思っていたのだが、ひょっとしたら、全項目を聴取しなくても個々人の因子得点推定が可能ですと説得するより、個々人は無理だがPVってのがありますよと説明したほうが、ピンときたりするかしらん? うーむ、そんなわけないか。この論文とは全然関係ない話だな。
論文:データ解析(-2014) - 読了: von Davier, Gonzalez, & Mislevy (2009) Plausible values とはなんぞや
2012年4月 4日 (水)
逃亡のガルヴェストン (ハヤカワ・ミステリ)
[a]
ニック・ピゾラット,東野 さやか / 早川書房 / 2011-05-09
久々に海外小説に手を出してしまった。
気晴らしのつもりであまり期待せずに読みはじめ,おお,これはクライムノヴェルとして始まり人情話として終えるという趣向か... などと気楽にフガフガとめくっていたのだが,読み終えてからはじめて,これは案外な傑作であると感心した。ラストに至って読み手の心を動かす小説である。
この小説にはちょっと仕掛けがあって,中盤でいきなり時間をずらし,ある意味で筋を割ってしまう。かなりな賭けだと思うのだが,実にうまく働いている。こういうの,いったいどうやって思いつくんだろう,としばらく考え込んだ。
2012年4月 3日 (火)
国語審議会─迷走の60年 (講談社現代新書)
[a]
安田 敏朗 / 講談社 / 2007-11-16
国語審議会の歴史を批判的に辿る本。本屋で虫が知らせたのだが,案の定,とても面白かった。
敗戦後すぐに,ソビエト言語学の影響のもとで敬語消滅論が唱えられたという話は,(タカクラ・テルの名とともに) 漠然と知っていたのだが,その背景には,敬語が天皇制とセットにして考えられてきたという歴史があるんですね。そうかー。
この本のおかげで知ったのだが,2004年の文化審議会答申「これからの時代に求められる国語力について」というのはなかなかすごい。webで探して読んでみたら,後半部分になるとなるほどもっともなことが書いてあったりもするのだが(司書教諭の活動時間を確保するとか),前半の突っ走りかたがただごとではない。「国語力の向上を目指す理由」という見出しの下では,
さらに,近年の日本社会に見られる人心などの荒廃が,人間として持つべき感性・情緒を理解する力,すなわち,情緒力の欠如に起因する部分が大きいと考えられることも問題である。情緒力とは,ここでは,例えば,他人の痛みを自分の痛みとして感じる心,美的感性,もののあわれ,懐かしさ,家族愛,郷土愛,日本の文化・伝統・自然を愛する祖国愛,名誉や恥といった社会的・文化的な価値にかかわる感性・情緒を自らのものとして受け止め,理解できる力である。この力は自然に身に付くものではなく,主に国語教育を通して体得されるものである。
なあんて,ものすごいことが書いてあるのである。なんという精神主義。あれもこれも背負い込まされた国語教育には深く同情する。
この答申を出した国語分科会の委員名簿には,いやまあそれはかの藤原正彦大先生なども入ってんだけど,私が敬愛している翻訳家の名前や,私がとてもお世話になった,とても理知的な,尊敬すべき心理学者の名前も入っている。ううむ,世の中いろいろあるんだなあ。
ミュジコフィリア(3) (アクションコミックス)
[a]
さそう あきら / 双葉社 / 2012-03-28
現代音楽をテーマにした青春ストーリー。面白いんだけど... めんどくさそうな若者たちだなあ。
Johnston, B. & Schwartz, C. (1977) The analysis of an unbalanced paired comparison experiment by multiple regression. Journal of the Royal Statistical Society, Series C (Applied Statistics), 26(2), 136-142.
いわゆるシェッフェの一対比較法では,t 個の刺激から2つを取り出す t(t-1) 個のペアに対して被験者を割り当てるが,解説書の計算例では決まってきれいに均等割り当てされている。unbalancedな場合についての解説はないものかと,あれこれ探してみたものの,少なくとも日本語では全然見あたらなかった。実務場面では毎度そうそうきれいには割り付けられないだろうから,これはどう考えてもFAQだろうと思うのだが。私の探し方が悪いのかしらん。
仕方がないので,解説書の手順に頼らずに自力でどうにかしようと覚悟し,その練習のために読んだ。unbalancedだったり妙な欠損があったりする,やたらに複雑なデザインの一対比較課題を挙げ,重回帰でパラメータ推定してみせるという,チュートリアル的な論文。
記号が死ぬほどまどろっこしく,嫌々メモを取りながら読んだ。
対象者 k が刺激 i を r番目 (r={1,2}) にみたときの評価を
X_{irk} = \mu + \tau_i + \phi_r + \alpha_{ir} + \psi_{irk}
とする。\tauは刺激の効果、\phiは提示順序の効果、\alphaは刺激と提示順序の交互作用,\psiは誤差。刺激 i と j の一対比較評価 Y_{ijk} は X_{i1k} - X{j2k} 、すなわち
Y_{ijk} = (\tau_i - \tau_j) + (\phi_1 - \phi_2) + (\alpha_{i1} - \alpha_{j2}) + (\psi_{i1k} - \psi_{j2k})
である。\phi_1 - \phi_2を \phi, \alpha_{i1} - \alpha_{j2}を (\tau\phi)_{ij},\psi_{i1k} - \psi_{j2k}を \psi_{k(ij)}と書く (あああ...キタナイ...)。さらに刺激の組み合わせの効果 \gamma_{ij}を追加する。結局
Y_{ijk} = \phi + (\tau_i - \tau_j) + \gamma_{ij} + (\tau\phi)_{ij} + \psi_{k(ij)} (ただし i \neq j )
である。この式に以下の制約がかかる。
- \sum tau_i = 0。
- \sum_i \gamma_{ij} = 0。
- \gamma_{ij} = - \gamma_{ji}。組み合わせの効果だから。
- (\tau\phi)_{ij} = (\tau\phi)_{ji}。順序効果だから。
さて,深呼吸して,式の右辺をダミー変数W_0, W_1, ...の線形和に書き下す。刺激数が3の場合,
- \phi は \phi W_0 と書き換える。W_0は常に1。
- (\tau_i - \tau_j) は \tau_1 W_1 + \tau_2 W_2 + \tau_3 W_3 と書き換えることができる。ここでW_1, W_2, W_3は{-1, 0, 1}の3値をとるダミー変数で,たとえば刺激(1,2)の比較の場合はW_1 = 1, W_2 = -1 となる。制約1より,\tau_3 = -(\tau_1+\tau_2) だから,これは\tau_1 (W_1-W_3) + \tau_2 (W_1 - W_3) とも書ける。結局,W_1-W_3と,W_1-W_3という2つのダミー変数を考えればいいわけだ。これをW'_1, W'_2 とする。
- \gamma_{ij} は \gamma_{12} W_4 + \gamma_{21} W_5 + ... + \gamma_{32} W9。制約2と3を合わせると,\gamma_{12}さえ決まっちゃえば,\gamma_{21} = -\gamma_{12}, \gamma_{13} = -\gamma_{12}という風に,残り全部が決まってしまう。結局,\gamma_{12} (W_4 - W_5 - W_6 + W_7 + W_8 - W_9) となり,ある1つのダミー変数だけについて考えればよいことになる。これを W'_3とする。
- (\tau\phi)_{ij} は (\tau\phi)_{12} W_{10} + ... + (\tau\phi)_{32} W_{15}。めんどくさいから省略するが,結局 W_{10}+W_{11}-W_{12}-W_{13} と -W_{12}-W_{13}+W_{14}+W_{15} という2つのダミー変数について考えればよいことになる。これをW'_4, W'_5とする。
というわけで,このモデルは結局のところW'_1, W'_2, ..., W'_5 という5つの謎のダミー変数の重回帰として推定できるわけだ。こうすれば,unbalancedな場合でも容易に推定できる。
そのほか,データに構造的欠損があった場合はどうするか (交絡しちゃった交互作用項を外しなさい),被験者内要因や被験者間要因を追加するにはどうするか(ややこしくなるけど頑張りなさい),といった例が紹介されている。根気が尽きて飛ばし読み..
なんで1977年に書かれたあまり有名でない論文なんぞをネチョネチョと読んでいるのかと,どんよりした気分になってきたのだが,ま,ダミー変数の作り方がわかったのでよしとしよう。
それにしても,以前から疑問に思っていることがあって... 官能検査関係の本を読んでいると,シェッフェの一対比較法と並んで,芳賀の変法とか浦の変法とか中屋の変法といったアレンジが載っている。あれ,別に国際的に有名な手法というわけではないと思うが,どうなんだろう。諸外国ではどういう方法を使っているのだろうか。日本国内で日本ローカルな手法が広く使われているというのは,そのこと自体を悪いといってはいけないのだろうけど(数量化理論が好きな人とかが怒り出しそうだし),なにか取り残されているのではないかしらんと,ちょっと不安になる事態ではある。
論文:データ解析(-2014) - 読了:Johnston & Schwartz (1977) 不釣り合い型な一対比較実験データを重回帰で分析してみせよう