2013年4月28日 (日)
Asparouhov, T., Masyn, K., Muthen, B. (2006) Continuous time survival in latent variable models. Proceedings of the Joint Statistical Meeting 2006, ASA Biometrics section, 180-187.
連続時間生存モデルを潜在変数モデリングの枠組み(というかMplusの枠組み)へと一般化します、という内容。著者らはMuthen導師とその弟子たち。仕事の都合で、メモをとりながら必死に読んだ。
潜在変数モデリングにCox比例ハザードモデル(PHM)を組み込んだ先例としてはLarsen(2004, 2005, ともにBiometrics)というのがあり、本論文はその拡張である由。へー。
まずPHMの説明。いわく、PHMには2種類ある。
- 「完全にノンパラなPHM」。え、PHMはセミパラメトリックでしょう? と思ってしまうが、著者らがいいたいのはそういうことではなくて、ベースライン・ハザード関数を出成りで決める(経過時点ごとに推定する)ことを指している。これをCox回帰という。推定の方法には、Breslow尤度アプローチ(プロファイル尤度アプローチ)というのと、Coxのアプローチ(部分尤度アプローチ)があるが、この2つは結局同じことである。なにがなんだかわからんが、そうですか。
- 「パラメトリックなPHM」。著者の言い方では、ベースライン・ハザード関数として指定した区間を持つ階段関数を用いる場合がこれにあたる。階段関数のパラメータ(段数だけある)の推定方法には2種類ある。ひとつは普通のパラメータとして扱う方法で、SEが出るし、形状に制約が掛けられるし、有限混合モデルのときに不変性制約を掛けられる。でも段数が多いと大変。もうひとつは局外パラメータとして扱うことで、計算が楽である由。どう計算すんのかよくわかんないけど、まあいいや。
後者のアイデアは強力で、たとえばワイブル分布を近似することもできる。ワイブル分布は、パラメータを$(\alpha, s)$として
$\delta(t) = \alpha s (\alpha t)^{s-1}$
である。これを近似するためには、まず時間をみじん切りにする。生存時間の上限を$M$、みじん切りにしてできた区間数を$Q$とする (50か100もあればよろしい由)。幅は $h=M/Q$。$i$ 番目の区間の真ん中の時間は $t'= h ( i- 0.5 )$。これを上の式の $t$ に代入した値を、その区間の高さ $h_i$ にすればよい。すなわち
$h_i = \alpha s ( \alpha (M/Q) (i-0.5) )^{s-1} $
という制約をかければいいわけだ。
Cox回帰だろうがパラメトリックPHMだろうが、尤度関数は変わらない。時間を$T$, 生存関数を$S(T)$, ベースラインハザード関数を $\lambda(T)$, 共変量とその係数を $\beta X$, 打ち切りインジケータを $\delta$ として、尤度関数は
$L (T) = (\lambda(T) exp(\beta X))^{1-\delta} S(T)$
こうやってきれいに書いちゃうと簡単にみえますけどね。
ここまでは、まあ前説である。いよいよ本題の、生存時間モデルを潜在変数モデルの枠組みに統合するという話。
まず記号の準備。いきなり大仕掛けになって... クラスタ $j$ の 個体 $i$ の、$r$個目のイベント時間変数の時点 $t$ におけるハザードを $h_{rij}(t)$, $p$個目の従属変数の値を $y_{pij}$、彼が属している潜在クラス$(1,...,L)$を $C_{ij}$とする。$y_{pij}$ が順序変数だった場合も考慮し、その背後に潜在連続変数 $y^*_{pij}$ を想定する($y^*_{pij}$について正規分布を仮定すればプロビット回帰である)。$y_{pij}$が連続変数だったらそのまま $y^*_{pij}=y_{pij}$ とする。これをベクトル表記して $y^*_{ij}$ とする。共変量のベクトルを $x_{ij}$ とする。
まずふつうの従属変数について。潜在変数のベクトルを $\eta_{ij}$ として、測定方程式は
$[y^*_{ij} | C_{ij} = c] =\nu_{cj} + \Lambda_{ij} \eta_{ij} + \epsilon_{ij}$
構造方程式は
$[\eta_{ij} = | C_{ij} = c] = \mu_{cj} + B_{cj} \eta_{ij} + \gamma_{cj} x_{ij} + \zeta_{ij}$
でもって、
$C(C_{ij} = c) ∝ exp(\alpha_{cj} + \beta_{cj} x_{ij})$
いつものmplusモデルと比べると、測定方程式から x_{ij} が抜けているなあ。
お待ちかねの生存時間モデルは、
$[h_{rij} (t) | C_{ij} = c] = \lambda_{rc}(t) Exp( \iota_{rcj} + \gamma_{rcj} x_{ij} + \kappa_{rcf} \eta_{ij})$
この式を見た瞬間に、この論文読むのやめようかと思いましたが、よく見るとそんなに難しいことはいっていない。要するにPHMだ。
以下、モデル識別のための制約の話と(例, 実際にはクラスごとの\iota_{rcj}は推定できない)、マルチレベルへの拡張の話が続くが、省略。
この枠組みで既存のいろんな生存モデルが説明できます、というわけで、3つの例を挙げている。
- ひとつめは frailty モデル。つい先日はじめて知ったのだが、ふつうのPHMのハザード関数
$h(t) = h_0(t) exp(\beta' x)$
に、共変量の項に個体間異質性を表す切片項を取り込んで($\beta$は変えない)、個体 i について
$h_i (t) = h_0(t) exp(\beta' x_i + u_i)$
としたのをfrailtyモデルというらしい。へーへーへー。知らなかったー。専門家でもなんでもないので、こういうときは気楽である。frailty ってなんて訳せばいいのかわからない。
この論文で挙げている frailty モデルは、異なるイベント時間変数 $T_1$ と $T_2$ が相関しているという例(夫の生存時間と妻の生存時間とか)。Clayton(1988)という人は、個体 $i$ におけるそれぞれのハザードを $h_{1i}(t), h_{2i}(t)$として
$h_{1i}(t) = \xi_i \lambda_1 (t)$
$h_{2i}(t) = \xi_i \lambda_2 (t)$
とモデル化したが($\xi_i$ は平均1のガンマ分布)、Mplus的観点からは、共変量がなくて切片がなくて潜在変数があってその係数が 1 、というPHM
$h_{1i}(t) = exp(\eta_i) \lambda_1 (t)$
$h_{2i}(t) = exp(\eta_i) \lambda_2 (t)$
で捉えることになる。Claytonとは分布の仮定が異なるが($\eta_i$は正規分布)、ま、結局は似たようなものだ。なお、このモデルについて人工データでシミュレーションすると、パラメトリックPHMアプローチのほうが若干優れていた、でもノンパラと比較することが大事だ、云々。 - ふたつめは 2レベルのfrailtyモデル。面倒くさいので飛ばし読み。
- みっつめは時間変動共変量。さあ、ややこしい話になってまいりました...
話を簡単にするためイベント時間変数を1つに絞る。共変量 $x_{ij}$ と 潜在変数 $\eta_{ij}$を時間依存にして、
$[h_{ij} (t) | C_{ij} = c] = \lambda_{c}(t) Exp( \iota_{cj} + \gamma_{cj} x_{ijt} + \kappa_{cf} \eta_{ijt})$
原文では $\iota, \gamma, \kappa$に添え字 $r$ が残っているけど、誤植だと思う。
で、共変量と潜在変数の値が、時点 $d_1, \ldots, d_K$ でがらっと変わると仮定する。深呼吸して、- まずは$0$から$d_1$までしか観察しないイベント時間変数 $T_1$ について考える。それは, もし本来のイベント時間 $T$ が $d_1$を超えていたら $d_1$で打ち切られ (打ち切りインジケータは $1$)、そうでなかったら $T$ となる(打ち切りインジケータは本来のインジケータ) ようなイベント時間変数である。
- $d_1$から$d_2$までしか観察しないイベント時間変数 $T_2$ について考える。それは、もし本来のイベント時間 $T$ が $d_2$を超えていたら $d_2$ で打ち切られ (打ち切りインジケータは$1$)、$d_1$を下回っていたら欠損となり(打ち切りインジケータも欠損)、どちらでもなかったら $T$となる(打ち切りインジケータは本来のインジケータ)ようなイベント時間変数である。
- ...以下同文。
要するに, つぎの3つの条件を考えればいいわけだ。
- $d_k \lt T$ のとき, $T_k = d_k - d_{k-1}, \delta_k = 1$
- $d_k \lt d_{k-1}$ のとき、$T_k = missing, \delta_k = missing$
- どちらでもないとき、$T_k = T - d_{k-1}, \delta_k = \delta$
先生、もうお腹いっぱいなんですが... 残る話題は3つ。
- 混合モデルにおけるLarsenのアプローチとMplusのアプローチのちがいについて。著者らいわく、たとえばクラスによって異なるハザード関数を推定するとき、Larsenはクラス間でベースライン・ハザード関数の比例性を仮定する ($\lambda_2(t) = \alpha \lambda_1(t)$ というように)。いっぽうMplus的には、クラス間のちがいにそういう制約を掛ける必要がない。さらに、仮に比例性が成り立っていたとしても、Mplus的アプローチのほうが精度が良い(へええ?)。なお、混合モデルの場合、潜在クラスごとに比例ハザード性があればよいのであって、全体で比例ハザード性が成り立っている必要はない(なるほど)。
- 離散時間生存モデルとのちがいについて。連続的なイベント時間変数 $T$ があるとき、連続時間生存モデルを使おうが、細かく区切って離散時間モデルを使おうが、細かく区切ってなおも連続時間生存モデルを使おうが、区切りが十分細かければ、結果はたいして変わらない由(離散時間モデルは推定が大変になるけど)。
- 推定手法間の比較。SASのPHREGプロシジャは、Breslowの部分尤度アプローチ、Efron尤度アプローチ、正確尤度アプローチ、離散尤度アプローチ、を搭載している。いっぽうMplusはBreslowのプロファイル尤度アプローチと離散のふたつを搭載。シミュレーションしてみると、連続時間の場合はどれもたいしてかわらない。離散時間の場合はSASのEfronと正確法がちょっと有利。Mplusが積んでいる方法だけで比べると(だって奴らには潜在変数が扱えないもんね、とのこと)、データがほんとにカテゴリカルで、かつカテゴリ数が20以下だったら、離散時間としてモデリングした方がよい。サンプルサイズが大きいときには特にそう。いっぽう他の場合には、Breslowアプローチのほうが良い。
いやー、疲れたけど、ほんとに助かった。Mplusを使っていてわからなかったことがいっぱいあったのだが (例, なぜ「パラメトリックPHM」なのにベースライン・ハザードがなだらかにならないのか)、この文章のおかげでようやく理解できた。
それにしても、Muthen一家の論文は、私のような素人にとってもほんとにわかりやすい。お歳暮でも贈りたいところだ。
論文:データ解析(-2014) - 読了: Asparouhov, Masyn, & Muthen (2006) さあSEMで生存時間をモデリングしようじゃないか
2013年4月25日 (木)
あるときある消費者が買い物に行きましたとか、あるカテゴリの商品を買いましたとか、そういう現象を時間軸上で統計的にモデル化しようとするとき、ひとつのアプローチはそれを交通事故のような現象だと捉えることだけれど、買い物は交通事故と違ってその人の前日までの買い物に影響されるので、その履歴を考慮しないのはもったいない。とくに最近ではID-POSやらなんやらで、個人ベースのデータがあふれているので、もう少し工夫しようと欲が出るのが人情である。
そういうときに用いられるのが、生存時間分析で使われる比例ハザードモデルである。いわば購買を死に見立てた生存モデルだ。マーケティング・サイエンスというと派手派手しいけど、このように道具は医学統計から借りてきたものだったりするので、あまりびびってもいけないと思う。
Seetharaman, P.B., & Chintagunta, P.K. (2003) The propotional hazard model for purchase timing: A comparison of alternative specifications. Journal of Business & Economic Statistics. 21(3), 368-382.
購買タイミングに対する比例ハザードモデル(PHM)を比較検討。仕事の都合で読んだ。
実データを使って以下の5点について検証する。
- 時間が連続的な普通のPHMと、時間を離散的にしたPHMのどっちがいいか。
- パラメトリックPHMでベースライン・ハザードとして用いる関数はどれがいいか。指数とかワイブルとか対数ロジスティックとか。
- 普通のPHMと競合リスクモデルのどっちがいいか。
- パラメトリックPHMとノンパラメトリックPHM(ベースライン・ハザードを出成りで決める奴)のどっちがいいか。
- ふつうのPHMと対象者間異質性つきPHMのどっちがいいか。
というわけで、以下のモデルを用意する。時点を t , 共変量を X_t とする。
- ふつうのPHM。ハザード関数(つまり瞬間購買確率)は
h(t, X_t) = h(t) * e^{X_t \beta}
ベースライン・ハザード関数 h(t) としてはワイブル分布が用いられることが一番多いのだそうだ。ふうん。
以降の話のためにちょっと丁寧に追っていくと、時点 t に購買が生じる確率密度関数を f(t, X_t), その累積密度関数を F(t, X_t) として、生存関数は S(t, X_t) = 1- F(t, X_t)。ハザード関数との間には h(t, X_t) = f(t, X_t) / S(t, X_t) という関係がある (生きている人でないと死ねないので)。これを解くと、
S(t, X_t) = e^{-\int_0^t h(u) * e^{X_t \beta} du}
となる。うんざりするような式だけど、要するに生存関数はexp(-累積ハザード関数)です, 累積ハザード関数はハザード関数の積分です、ということであろう。 - 離散時間PHM。grouped PHMともいう由。時間 t を離散的に扱う("measured in the time interval of shopping trips (usually weeks)"とのこと)。生存関数は
S(t, X_t) = e^{-\sum_{u=1}^t e^{X_u \beta} \int^u_{u-1} h(w) dw}
連続的PHMの生存関数の \int_0^t ... du が \sum_{u=1}^t ... に書き換えられ、e^{X_t \beta} が e^{X_u \beta} に書き換えられ、瞬間のハザードであった h(u) が期間のハザード \int^u_{u-1} h(w) dw に書き換えられているわけだ。ここからハザード関数を逆算すると
Pr (t, X_t) = 1 - e^{ -e^{X_t \beta} \int^t_{t-1} h(u) du }
となる由。mplus でも離散時間生存モデルを推定できるけど(成長曲線モデルみたいにアウトカムを時点別に変数にする)、それと同じことなのかどうか、よくわからない。 - 上記の2つのモデルの、ベースライン・ハザード関数を変えた奴を用意する。ワイブル分布のほかに、指数分布(ハザード関数は定数。つまりはメモリレスなモデルだ)、Erlang-2(ハザード関数は単調増加)、対数ロジスティック、expo-powerを試す。
- 競合リスクモデル。離散時間PHMに基づき、ある製品を前の期に買っていた場合のハザードと買っていなかった場合のハザードを別々に推定する(Pr (t, X_t) の式のなかの、共変量の係数 \beta とベースライン・ハザード関数 h() の両方を別々に推定する)。他の問題での使用例はあるが、購買タイミングのデータで推定するのはこの論文が初めてである由。
- ノンパラメトリックPHM。ハザード関数は
Pr (t, X_t) = 1 - e^{ -e^{X_t \beta + \alpha_t}}
となる。時点の効果 \alpha_t を時点の数だけ推定するわけだ。 - 上記のモデルのすべてに世帯間異質性を組み込む。モデルのパラメータ(せっかくなのですべてのパラメータ)が、世帯間で多変量離散分布に従うと仮定する。どうやらその潜在クラスのことをサポートというらしい (知らなんだ...)。連続時間PHMと離散時間PHMでは\betaとh()をサポートごとに推定。競合リスクモデルでは \betaとh()をサポートごとにふたつづつ推定。ノンパラPHMでは\betaと\alpha_tを全部サポートごとに推定。
実データはIRIのスキャナー・パネル・データ。買い物行動の発生ではなく、洗濯洗剤とペーパータオルの購買をモデル化する。共変量は、価格、ディスプレイ、チラシ、インベントリー(世帯内の買い置きのことであろう。どうやって調べたんだろう...)。すべて最尤法で推定。ええと、連続時間PHM, 離散時間PHM, 競合リスクモデルのそれぞれについてハザード分布が5通り、ノンパラPHM(100時点)と合わせて16個。さらに異質性を組み込んだやつも推定するわけだ。で、モデルのSBC (BICのことであろう)を比較する。
結果は...
- 離散時間PHMはうまくいくが連続時間PHMはうまくいかない(共変量の符号が変になる)。これは、連続時間PHMが「買い物に行ったけど買わなかった」と「買い物に行っていない」を区別していないからである 。
- ベースライン・ハザードとしてはexpo-powerがお勧め。
- 競合リスクモデルはうまくいき、前期で購買したときと非購買だったときで共変量の効果がちがっており、豊かな知見が得られた。
- わざわざノンパラPHMを推定してもたいしたメリットはない。
- 異質性を組み込むと(サポートは3つ)、あてはまりは良く、ベースライン・ハザードの水準と形状がサポート間で大きく変わった。
今後の課題としては... 最尤法で推定したけど今後はMCMCが有望。異質性についてはHB推定が有望。時間変動共変量だけでなく時間不変共変量についても要検討。離散PHMについては連続的確率密度だけでなく離散的確率密度も要検討。パラメータが非定常である場合も要検討。PHMと加法リスクモデル(ARM)との比較も要検討。
離散時間PHMを導入するところで派手につまづいてしまい、読むのに時間がかかった。わからなくなったのは、離散時間PHMを実データを当てはめる際に t をどのように離散化したのか、という点だ。散々悩んだのだが、おそらくほんとに週で区切ったのではないかと思う。とすると、「この週は買い物にいかなかった」人が少数ながらも生じてしまい、結局は「買い物に行ったけど買わなかった」と「買い物に行っていない」の区別がつかなくなるのではないか、という疑問が残っているのだが...。
上記の混乱は私の予備知識が足りないからであって、総じてとてもわかりやすく、非常に勉強になる論文だった。説明がきびきびしていて、実にありがたい。ここ数日で何本か読んだ類似の論文と同じことを説明していても、こちらのほうが断然わかりやすい。他の学者さんたちにも見習ってほしいよ。
前々から不思議に思っていたのだけれど、ID-POSやスキャナー・パネルのデータを使ってブランド購買をモデル化する際、往々にして当該カテゴリの購入記録だけを抽出して分析しているように思う。でも、ある来店におけるカテゴリ非購買には複数種類あるから(カテゴリがほしくなかった、買いたいブランドがなかった)、それらのちがいを考慮しないと、ブランド購買のモデルにバイアスが生じるのではないか、という疑問があった。この論文はカテゴリ購買タイミングのモデルだけれど、単位期間におけるカテゴリ非購買に複数種類あり(非来店、来店非購買)、それが共変量の効果にバイアスをもたらすという点で、結局は同じ問題を抱えているわけだ。おかげで霧が晴れたような思いである。やっぱし、見よう見まねではなくて、ちゃんと勉強せんといかんね。
論文:データ解析(-2014) - 読了:Seetharaman & Chintagunta (2003) 購買タイミングの比例ハザードモデル
2013年4月20日 (土)
Ferjani, M., Jedidi, K., Jagpal, S. (2009) A conjoint approach for consumer- and firm-level brand valuation. Journal of Marketing Research. 46(6), 846-862.
ちょっと関心があってめくった論文。大上段から話が始まるし、聞き慣れない経済学の用語が出てくるし、本筋を見失いそうになったが、要するにこういう話だ。(1)コンジョイント分析でブランド名と属性と価格の部分効用を推定する。(2)そこから消費者ベースのブランド価値を求める。(3)さらには企業ベース(収益ベース)でのブランド価値まで求めてしまう。
序盤はわからないなりに丁寧に読んだので、メモをとっておくと...
消費者 i が ブランド j の属性 m について感じる知覚価値を \tilde{x}_{ijm}, イメージ次元 k に対する連想の強さを z_{ijk} とする。ブランド j の価格を p_j とする。
いま消費者 i が ブランド j を 1 個買おうかしらどうしようかしらと考えているとしよう。消費者の選好は準線形な効用関数で表され、消費者 i にとっての現状は単価 p^w_i, 購入個数 q_i の合成財の購入で表現できるとしよう (合成財とは、要するに「そのほか」を表す架空のブランドのことであろう。むやみに経済学の用語を使うのはやめてほしい... こっちは素人なんだから)。
消費者 i の効用関数を U_i (n_{ij}, q_i) とする。n_{ij} は消費者 i がブランド j を選んだときに1, そうでないときに0になる変数。予算を w_i とする。で、すべての消費者が、予算を使い切って U_i (n_{ij}, q_i) を最大化する、と仮定する。つまり、q_i は「残りのお金で合成財があと何個買えるか」である。
j を買う場合の間接効用 U_i (1, q_i) について次のように考える (間接効用というのは、どうやら価格と予算で条件づけた効用のことをいうらしい。もっと易しく書いてくださいよ... 経済学部の奴ってほんとにいやらしいなあ)。それは z_{ij1}...z_{ijK}と, \tilde{x}_{ij1}...\tilde{x}_{ijM}と、「残りのお金で合成財があと何個買えるか」と、切片と誤差の線形結合であると考える。めんどくさいから式は書かないけど、切片は (i,j) ごとに、zの係数は(i,k) ごとに、xの係数は(i,m)ごとに、「あと何個買えるか」の係数 b^p_i は i ごとに、それぞれ決まる。いっぽう、j を買わない場合の間接効用 U_i (0, q_i) は、「合成財を何個買えるか」と誤差の線形結合である。係数はさっきの b^p_i。
さて、著者らはブランドの知覚価値やイメージ連想について消費者に訊くつもりはさらさらない。代わりに、ブランド属性の客観的なデータが手に入っている場合について考える。ブランド j の属性 m における客観的な値を x_{jm} とする。\tilde{x}_{ijm}は、客観的値 x_{jm}と、価格 p_j と、切片と誤差の線形結合で決まるものと考える。切片も係数もすべて(i,j,m)によって決まるものとする。
これを U_i に代入して一本の式にすると、すごく長くて退屈な式になる。ところが... 著者いわく、要するにブランドの価値がわかればいいんだから、ある人があるブランドについてどういうイメージをもっているかなんてどうでもいいでしょう、と。だから z の効果はすべて、(i,j)によって決まる切片に放り込んでしまう。どんどん簡略化して、結局
U_i (n_{ij}, q_j) = \beta_{ij0} + \sum_{m} b^x_{ijm} x_{jm} - \beta^p_{ij} p_j + \epsilon_{ij}
と書ける(最初からそう書いてよ...)。著者曰く、これは属性からベネフィットへという一般的な情報処理方略を表し、ブランド・エクイティの多様な発生源を捉えたモデルである (壮大な言い回しだなあ...)。
このモデルを、選択型コンジョイント課題での各試行の選択にあてはめる。対象者 i は試行ごとに、U_i (n_{ij}, q_i) が最大でありかつ U_i (0,q_i) よりも大きくなるような s を選ぶ (なかったら「どれも選ばない」を選ぶ) と考える。b^x_{ijm}と \beta^p_{ij}が部分効用になる。i の間で部分効用がMVNに従うと仮定しベイズ推定する。
無事推定できたとして、消費者レベルのブランド価値は、そのブランドの WTP と、同じものが「ノーブランド」である場合のWTPとの差として推定できる。それはブランド自体の価値、その属性による価値、そのブランドの価格感受性、に分解できる。
いっぽう、企業レベルのブランド価値は、そのブランド名を使った時の利益と、使わなかった時の利益の差である。利益の算出のためには、売上数量とシェアと単価と製造コストとマーケティング活動費があればよいが、利益の差を出すためにはさらに「ブランド名を使った時の売上数量」「ブランド名を使わなかった時の売上数量」が必要になる。それを認知率と配荷率から求めていくんだけど、力尽きたので飛ばし読み。「使わなかった時」の認知率と配荷率について、目標値を使う、PBの値を参考にする、ゲーム理論で求める、の3つの方法がある由。
実例は、ヨーグルトのコンジョイント課題。属性はブランド名、フレーバー、価格。いくつかモデルをつくってベイズファクターを比較して、結局はブランドの効用(個人別)、ブランドとフレーバーの交互作用の効用(個人別)、価格(これは全体レベル) がはいったモデルを採用する。消費者レベルのブランド価値と企業レベルのブランド価値を求めておられるが、飛ばし読み。
かなり幻惑されたが、冷静に考えると、(1)コンジョイント分析でブランドの効用を推定、(2)消費者ベースのブランド価値を求める、(3)企業ベースでのブランド価値を求める ... のうち、
- (1)に特に新しいところはないと思う。ひょっとしてモデルが新しいのかと思って数式を追ったのだが、私には普通のコンジョイント分析のモデルとどうちがうのかわからなかった。
- (2)についても、どこが新しいのかわからない。コンジョイント分析で求めたWTPと、そのブランド名を「ノーブランド」に代えたときのWTPとの差をブランド・エクイティとする、というやりかたは何度か読んだことがある。著者らも言及している Park & Srinivasan(1994, JMR)ってのがまさにそれじゃなかったっけ? 著者らは Swait, Erdem, Louviere & Dubelaar (1993, IJRM) というモデルの結果と比較しているけど、そもそも測定しようとしているブランド・エクイティの概念がちがうようだし...
というわけで、きっと(3)が新しいんだろうと思う。よく理解できないけど。
しっかし、ブログでこういう正直な感想を書いて無知をさらすのって、どうなんでしょうね...
正直いってだんだん関心を失ってしまったのだが(すいません)、読み始めたきっかけは、コンジョイント課題で「ノーブランド」というブランドをどうやって提示するんだろう、という変なところに興味があったからであった。著者らは、ダノンやヨープレットのような実在する主要ブランドと並べてSemsemという架空のブランド名をしれっと提示し、当たり障りのないコンセプト記述をつけている。名前からの推論が気になるんなら、複数の架空ブランド名を使えばいいんじゃないですか、とのことであった。なるほどね。とはいえ、著者らも最後にちょっと触れているけど、消費者調査での「ノーブランド」の提示の仕方って、なかなか難しい問題だと思う。
消費者ベースのブランド・エクイティをコンジョイント分析やブラインド・テストのような消費者テスト・データから直接測る、というのは、私の仕事の関係でもかなり大事な話で、前職で学会発表をさせてもらったこともある。考えてみれば、ああいうデータはある程度大きな調査会社の人でないとアクセスできないし、いろいろな付加価値にもつながっていくんだから、そういう立場にある皆様はもっと頑張ればいいのに、と思うんだけど、まあどうでもいいや。Iyengar, Jedidi, Kohli (2008, JMR)がテレコム分野でそういう分析をしているそうだから、いずれ読んでみよう。
論文:マーケティング - 読了: Ferjani, Jedidi & Jagpal (2009) 消費者ベースのブランド価値はおろか、企業収益上のブランド価値まで、コンジョイント分析一発で調べてみせましょう
2013年4月19日 (金)
Telang, R., Boadwright, P., Mukhopachyay, T. (2004) A mixture model for internet search-engine visits. Journal of Marketing Research, 41(2), 206-214.
仕事の都合で目を通した。購買でも店舗訪問でもいいから、繰り返し生起する行動の間隔を生存モデルで分析した実例を読みたかったのである。きっとこの分野の方には基礎知識に属する話だろうから、ちょっと恥ずかしいんだけど。
えーと、論文の主旨としては... NBD(負の二項分布)やPHM(比例ハザードモデル)に基づく購買間隔の確率モデルがいまいち使われていないのは(←そうなんですか?)、購買の周期性 periodicity を説明できないからだ。そこで,周期性を取り込んだモデルを作ってごらんに入れましょう、とのこと。
基本的なアイデアは次の通り。24時間の周期性を想定し、日内の確率分布としてラプラス分布を想定し(正規分布より裾が厚い)、それを24時間で切り落とし横につなぐ。数式をちゃんと追いかけてないけど、24時間周期の波型になるような確率密度分布をつくるのであろう。これをf_{TL}(t)とする。式で書くとすごくややこしい。
で、ある人のある時点の訪問有無は、確率pで(この周期と無関係に)ある確率密度分布 f_B(t)に従い,確率(1-p)でこの確率密度分布 f_{TL}(t)に従うと考え、混合分布 f_M(t)を導出する。これをハザード関数 h_0(t) に変換し、これをベースライン・ハザードにしたPHMをつくる... というのが基本アイデア。
PHMには共変量を突っ込むだけでなく、pやらf_B(t)のパラメータや共変量の係数やらについても消費者間異質性も入れ込む。ここの部分、support-pointという考え方が出てきて、どうやら潜在クラスのようなテクニックらしいのだが、予備知識がなくてよく理解できなかった。Heckman&Singer(1984, Econometrica), Jain & Vilcassim (1991, Marketing Sci.)を読めとのこと。絶対読まないと思いますが。
で、実データへの適用。126人の1年間のインターネット利用ログを用い、検索エンジンへの訪問を抽出。リストにgoogleが入っていないところに時代を感じる。共変量として、検索エンジンの累積利用回数 (ネット利用経験とともに検索の頻度は下がる、という仮説があったのだそうだ。これも時代だなあ)、検索エンジンサービスの検索以外の機能の利用回数、これらの交互作用。f_B(t)として、ワイブル、対数ロジスティック、expo-power, Conway-Maxwell-Poisson (なんだそれは) の4つを試す。さらに、f_{TL}(t)を入れる奴といれない奴を試す。
結果は ... f_{TL}(t)をいれたほうがよかった。セグメント数は2がよくて、周期性が強い人と弱い人に分かれた。f_B(t)としてはexpo-powerがよかった。共変量の効果はどうのこうの。ホールドアウトに対するヒット率はどうのこうの(面倒なのでスキップ)。
細かいところがどうもよく理解できなかった。これって、前回のアクセスから24時間後に「そろそろまたアクセスすんじゃないの」と勘繰るモデルなのだろうか? それとも「こいつはだいたい毎晩何時ごろにアクセスしよるわい」と推定するモデルなのか? そこさえ確信が持てない(前者だとすると、購買ならばともかくwebアクセスの分析としてはちょっと現実味がないなあ...)。この辺は著者のせいというより、私の読解の不足のせいだと思う。顔洗って出直して来いってことでしょうね。
論文:データ解析(-2014) - 読了:Telang, et. al. (2004) 検索エンジンへの訪問(とかそういう感じのなにか) の間隔を説明する周期性つきの生存モデル
2013年4月17日 (水)
連続変数のベクトル y を指標として持つ潜在クラスモデルについて考える(いわゆる潜在プロファイル・モデル)。話を単純にするため、共変量はなし、指標はすべて局所独立、条件つき分布に多変量正規性を仮定する。
対象者 i がデータ y_i を持っているとしよう。この人の所属クラス C が k である事後確率は
P(C=k | y_i) = P(C=k) [y_i | C=k] / [y_i]
ただし [y_i | C=k] は、クラス k の平均ベクトルと共分散行列を持つMVNである。みよ、大自然の単純な美しさを。
いったいなにを云わんとしているのかというと... 指標がV1とV2の2つしかない、2クラスの潜在クラスモデルを推定したとしよう。mplusが吐いたパラメータ推定値が
Latent Class 1: Means V1 3.248 V2 5.626; Variances V1 1.985 V2 8.243
Latent Class 2: Means V1 8.845 V2 5.298; Variances V1 1.985 V2 8.243
Categorical Latent Variables: Means C#1 0.220
であったとする。さて、V1=6, V2=4のオブザベーションがあったら、そのクラス所属確率は?
まず事前確率について。mplusはカテゴリカル潜在変数の平均を最後のクラスで 0 とするので、P(C=1) ∝ exp(0.22) = 1.24, P(C=2) ∝ exp(0) = 1。足しあげて割合にすると、0.55, 0.45である。
次に尤度。分子のほうだけ考える。Excel風に書くと、C=1ならばnormdist(6, 3.248, sqrt(1.985)) * normdist(4, 5.256, sqrt(8.243)) * 0.55 = 0.00351。C=2ならば0.00206。これを足しあげて割合にして、0.63と0.37。
これが事後確率である。mplusのSAVEDATAで出したものとぴったり、ぴったり一致する。みよ、大宇宙の壮大な神秘を。
なにが云いたいのかというと... マーケット・セグメンテーションの手法として、消費者調査データに基づく対象者分類を行った場合、あとで別の対象者に同じ調査項目を聴取し、その回答に基づいてその人がどのセグメントに属するかを判別したい、ということがある。ものすごくよくある。細かい商売ですみません。
で、分類の際にk-means法を使っていた場合は判別関数をつくるのは容易だが、潜在クラスモデルのような確率モデルをつくってしまうと、あとの判別が大変だ。などと思い込んでいる人がいる。愚かなり。実に愚かなり。
というか、私自身がついついそう思いこんでいたのである。このたび用事があってこの件について考える羽目になり、なんとか自分で考えずに済ませられないものかと考えたが逃げ道はなく、どんよりした気分で机の上に資料を揃え、気分転換用のお菓子も用意し、深呼吸してから考え始めた。15分後、菓子に手をつける間もなく、あまりの簡単さにあっけにとられている私がいた(お菓子は後で食べましたが)。私が愚かでした、反省してます。反省のあまりブログに記録する次第である。いっけんややこしそうだからといって、思考停止してはいけないのだ。
雑記:データ解析 - 潜在クラスモデルの所属確率について (反省の弁)
Discriminant analysis[a]
Klecka, W.R. / Sage / 1980-9-30
判別分析の入門書。amazonをみてたらなんだか評判がいいので、ためしに目を通した。このくらい古典的な内容だと、古い本のほうがかえってわかりやすいのではないかと思って。
内容は... 判別分析の用途、正準判別関数の導出 (ここはちょっと不親切。いきなり固有値が出てくる)、生の係数・非標準化係数・標準化係数、全構造係数・群内構造係数、固有値を割合にして評価する話、正準相関係数とその解釈(正準相関分析の観点から; 相関比の観点から)、Wilksのラムダとその検定。それから分類の話: 所属確率、事前確率の導入、分類行列とタウ、分割による妥当化。最後に、ステップワイズ変数選択の話(いま関心ないのでスキップ)。
きちんと読んでないけど... テクニカルな内容は、多変量正規性と等分散性という強気な仮定に基づくごく基礎的なレベルであった。求めていたものとはちょっとちがったし、あまり親切な書き方ではないのだけれど、ユーザ向けの良い解説だと思う。勉強になったような気がします。
データ解析 - 読了:Discriminant analysis
パパのデモクラシー
[a]
永井 愛 / 而立書房 / 1997-02
わたくしが敬愛しつつも恐怖してやまない劇作家の、1995年の作品。東宝争議やゼネストを題材に、敗戦後日本の平凡な市民の哀歓を描く。
完全な悪人も出てこないが、無垢な善人も出てこない。等身大の人々のささやかなやりとりのなかに、不意に暗い裂け目が広がる。この人の作品は、やっぱり、怖い。。。
近代家族の成立と終焉
[a]
上野 千鶴子 / 岩波書店 / 1994-03-25
消費者調査に関連する仕事をして糊口をしのいでいるのだが、世の中知らないことやわからないことばかりで、ときどきなんだか他の惑星からやってきた宇宙人になったような気がすることがある。仕事の話なのであまり書けないけど、最近ひょんなことから、結婚というものは実に奇妙なモノだなあと、目を見開くような機会があった。知っている人にとっては当たり前の、結婚にまつわるあれこれのなかに、考えてみれば随分不思議なことが隠れている。たとえば、結婚指輪って、あれ、いったいなんなのでしょうね。指に金属の輪っかをはめるんですよ?いったいどういうわけでそんなことに。
いまさら世間の常識や業界事情を学んでも追いつかないし、本質には迫れない。もっと原理的なところから考えなければ。。。と思い立ち、本棚に死蔵していた上野千鶴子のハードカバーを手に取った。大きな賞をとった本だし、さぞや読みにくかろうと放置していたのである。読み始めてびっくりしたのだけど、これ、雑誌の寄稿などの短い文章の集成であった。ちゃんと目次と後書きくらい読んでから買えってことですね。読みやすくて助かったけど。
面白かった箇所、勉強になった箇所は多かったが。。。日本近代における「家」概念の成立について概観した「日本型近代家族の成立」、江藤淳『成熟と喪失』の文庫本解説として書かれたという「『母』の戦後史」、そして家電製品の普及が家事労働にもたらした(もたらさなかった)変化について述べた「技術革新と家事労働」、の三編が特に面白かった。
お伊勢参り - 江戸庶民の旅と信心 (中公新書)
[a]
鎌田 道隆 / 中央公論新社 / 2013-02-22
江戸時代の「おかげまいり」について述べた本編も面白かったのだが、最終章、著者の先生が学生たちと毎年行っていたというお伊勢参りの話が面白い。これはやっぱり、学生たちの徒歩ツアーを無償で支える、街道沿いの人々が偉い。。。
小さな建築 (岩波新書)
[a]
隈 研吾 / 岩波書店 / 2013-01-23
琳派のデザイン学 (NHKブックス No.1202)
[a]
三井 秀樹 / NHK出版 / 2013-02-23
琳派は偉大だ! 日本は素晴らしい! という内容であった。うぐぐぐ。
ノンフィクション(2011-) - 読了:「琳派のデザイン学」「近代家族の成立と終焉」「お伊勢参り」「小さな建築」
トラウマ (岩波新書)
[a]
宮地 尚子 / 岩波書店 / 2013-01-23
前半で、トラウマについて著者が提案する「環状島モデル」なるものが紹介される。そんなの言葉の遊びだろうと思いながらフガフガと読み進めたのだが、あとで考えてみると、これはとても深い話だ。。。
理想だらけの戦時下日本 (ちくま新書)
[a]
井上 寿一 / 筑摩書房 / 2013-03
翼賛体制成立に至る数年間、政府が主導した「国民精神総動員運動」を手がかりに、太平洋戦争に突入する直前の日本社会を描く。
面白かった点をいくつかメモ:
- 銃後の婦人組織である愛国婦人会と国防婦人会は対立していた。これは社会階層を反映していた(愛国婦人会のほうがアッパークラス)。成瀬巳喜男に「まごころ」という映画があって(1939)、上流階層の婦人は愛国婦人会、これに対して「野の百合のように清楚」で「着飾らない」美しさがあるところのヒロインは国防婦人会なのだそうである。へええ。
- 「八紘一宇」といった日本精神の強調や日中戦争の理念が、当時の国民の支持を得ていたとは言いがたいようである。なるほど、そういうものか。
- 「戦前昭和の時代においてすでに家族共同体も地域共同体も失われていた。家族の相互扶助は行政が代替する。隣組は新たに作り出す。精動運動の側はいう。『我が国には古来、隣保相扶ける美風がありました』。どこまでさかのぼればそのような美風にいきつくのか。相互扶助は想像上の精神だった」「[現代に目を移して] 『日本を、取り戻す。』とのキャンペーンを繰り広げた政党が政権の座についた。[...] おそらくは取り戻すべき日本とは想像上の日本のことだろう。想像上の日本を取り戻すよりも新たな日本を作り出すべきである」
モダン・ライフと戦争―スクリーンのなかの女性たち (歴史文化ライブラリー)
[a]
宜野座 菜央見 / 吉川弘文館 / 2013-02
たまたま同じ時代を扱った本が重なったけれど... こちらは日本映画の研究者による、1930年代の映画における女性の表象についての本。これは面白い本であった。
成瀬の「乙女ごころ三人姉妹」という映画、ぜひ観てみたいものだ。。。
日本近現代史 - 読了:「モダン・ライフと戦争」「理想だらけの戦時下日本」
もやしもん(12) (イブニングKC)
[a]
石川 雅之 / 講談社 / 2013-04-05
進撃の巨人(10) (講談社コミックス)
[a]
諫山 創 / 講談社 / 2013-04-09
リバーシブルマン 2 (ニチブンコミックス)
[a]
ナカタニD. / 日本文芸社 / 2013-03-18
おかめ日和(16) (KCデラックス BE LOVE)
[a]
入江 喜和 / 講談社 / 2013-03-13
40代女性がターゲットの掲載誌(講談社「BE LOVE」)のなかでも、おそらくは有数の味噌臭さであろう日常コメディ。次巻がいよいよ最終巻になる由。お疲れ様でした。。。
OL進化論(34) (ワイドKC モーニング)
[a]
秋月 りす / 講談社 / 2013-03-22
コミックス(2011-) - 読了:「OL進化論」「おかめ日和」「リバーシブルマン」「進撃の巨人」「もやしもん」
団地ともお 21 (ビッグコミックス)
[a]
小田 扉 / 小学館 / 2013-01-30
イムリ 13 (ビームコミックス)
[a]
三宅乱丈 / エンターブレイン / 2013-03-25
ゼクレアトル~神マンガ戦記~ 2 (裏少年サンデーコミックス)
[a]
/ 小学館 / 2013-03-18
刻刻(6) (モーニング KC)
[a]
堀尾 省太 / 講談社 / 2013-03-22
チェーザレ 破壊の創造者(10) (KCデラックス モーニング)
[a]
惣領 冬実 / 講談社 / 2013-03-22
ルネサンス期のイタリアと、チェーザレ・ボルジアの若き日々を描く作品。不定期連載なので、いつ中断してしまうかと、気が気でない。
山賊ダイアリー(3) (イブニングKC)
[a]
岡本 健太郎 / 講談社 / 2013-03-22
コミックス(2011-) - 読了:「団地ともお」「チェーザレ」「刻々」「ゼクレアトル」「イムリ」「山賊ダイアリー」
毎日バタバタとしていて、本も思うように読めない。。。
ブラック・ジャック創作(秘)話~手塚治虫の仕事場から~ 3 (少年チャンピオン・コミックスエクストラ)
[a]
宮崎 克 / 秋田書店 / 2013-04-08
評判の連載、三巻目。いつもながら面白い。死の床の手塚治虫が、やせこけた顔で微笑む場面、これは反則だよ。。。
喰う寝るふたり 住むふたり 1(ゼノンコミックス)
[a]
日暮 キノコ / 徳間書店 / 2012-11-20
めしばな刑事タチバナ 9 [ラーメン・サバイバー] (トクマコミックス)
[a]
坂戸 佐兵衛 / 徳間書店 / 2013-04-02
レッド(7) (KCデラックス イブニング )
[a]
山本 直樹 / 講談社 / 2013-03-22
あさひなぐ 8 (ビッグコミックス)
[a]
こざき 亜衣 / 小学館 / 2013-03-29
ちいさこべえ 1 (ビッグコミックススペシャル)
[a]
望月 ミネタロウ,山本 周五郎 / 小学館 / 2013-03-29
「ドラゴンヘッド」の人気漫画家の新作は、意外にも山本周五郎の漫画化。原作の中編小説「ちいさこべ」(1957年発表)は、同時期の傑作群と比べるとちょっと格が落ちる作品だと思うのだが、そういう隙のある小説のほうが、きっと翻案しやすいのだろう。
コミックス(2011-) - 読了:「ちいさこべえ」「あさひなぐ」「めしばな刑事タチバナ」「レッド」「喰う寝るふたり住むふたり」「ブラックジャック創作秘話」