2015年4月28日 (火)
Kuhn, M. (2008) Building predictive models in R using the caret package. Journal of Statistical Software, 28(5).
Rのcaretパッケージについての開発者による紹介。頭が古いのかもしれないけど、実戦投入するパッケージについては、なにかこういうオフィシャルな文書に目を通しておかないと落ち着かないのである。
2008年発表の論文だから現在とは機能がずいぶんちがうかもしれないけど、一時的に2008年に戻ったつもりで... 調べてみると、福田さんが「あなたとは違うんです」と言い残して辞めた年、オバマさんが大統領になった年、「蟹工船」の文庫本が売れた年である。なんだ、つい最近じゃんか。ついでにいえば、70年代末のTVアニメ「未来少年コナン」で、超磁力兵器による地殻変動で世界中が海に沈んだ年でもある由。私は数年前にはじめて観たんですが、あれ、ホントに面白いですね。モンスリーさんが実に素敵である。
ええと、パッケージ名はclassification and regression trainingの頭文字。紹介されている関数は次のとおり。
- データ準備:
- createDataPartition(): データを分割する
- nearZweroVar(): 分散が0に近い変数をみつける
- findCorrelation(): 相関している変数をみつける
- preProcess(): 変数の変換
- モデル構築:
- train(): caratパッケージの主役。この論文の段階では、method引数で38個の方法を選べることになっている(現時点ではたしか90個以上になっているんじゃないかな)。
- 予測:
- predict.train(): train()の返し値やそのリストに対するpredict()
- extractPrediction(), extractProb(): train()の返し値のリストから予測や予測確率を抽出する
- 分類成績
- sensitivity(), specificity(), posPredValue(), negPredValue()
- confusionMatrix(): sensitivityやspecificityなどを含め、いろいろ要約してくれる
- roc(), aucRoc() [...という関数があることになっているが、現在はない模様]
- その他のモデリング用関数
- kkn3(): k近隣法
- bagEarth(): 多変量適応型回帰スプライン(MARS)のバギング版
- bagFDA(): 柔軟判別分析のバギング版
- plsda(): PLS回帰で判別分析
- 予測変数の重要性
- varImp(): 重要性を吐く。なにをもって重要性とするかはモデルによる。たとえば線形モデルなら t 値の絶対値。[←最新版できちんと調べておこう...]
webをみると、最新版の機能はこれどころでは済まない模様。ありがたいけど、参るね、どうも...
論文:データ解析(2015-) - 読了:Kuhn (2008) R の caret パッケージ
2015年4月27日 (月)
Kohavi, R. (1995) A study of cross-validation and bootstrap for accuracy estimation and model selection. IJCAI'95 Proceedings of the 14th international joint conference on Artificial intelligence. 1137-1143.
勤務先の仕事で予測モデルの正確性の評価についてお話していて、自分でもちょっぴり混乱するというか、一瞬言葉に詰まる場面があった。ちゃんと勉強しとかなきゃな、と思って目を通した。学会のproceedingsなんだけど、google scholar上の引用回数が4000を超えている。
原文は工学者っぽくきちんと書いてあるんだけど、簡略にメモ。
データから分類器を構築いたしました。その分類器の正確性 accuracy を評価したいです。どうやって評価するか。
えーと、ある事例$v_i$が持つラベルを$y_i$とする。データセット$D$(サイズ$n$)から構築した分類器が事例$v$に与えたラベルを $I(D, v)$と表す。関数$\delta(i,j)$を、値$i$と$j$が一致しているときに1, そうでないときに0である関数とする。話を簡単にするために、コストは正分類で0, 誤分類で1とする。
ひとつめ、ホールドアウト法。test sample estimationともいう。
データを相互排他な2つのサブセットに分ける。ひとつは訓練セットで、サイズは2/3とすることが多い。残りはテストセット(ホールドアウトセットともいう)。で、訓練セット$D_t$から分類器を構築し、ホールドアウトセット$D_h$(サイズ$h$)における正分類率を正確性の推定量とする。ふむふむ。せっかくなので式もメモしておくと
$acc_h = (1/h) \sum_{\langle v_i, y_i \rangle \in D_h} \delta(I(D_t, v_i), y_i)$
分類器構築は事例が多いほうが正確だとみなすなら、これはテストセットが大きいほど悲観的バイアスがかかる推定量である。しかしテストセットを小さくすると信頼区間が広くなる。要するに、ホールドアウト法はあんまし上手いやりかたじゃない。
なお、ホールドアウト法を $k$ 回繰り返して$acc_h$を平均するという手もある(ランダム・サブサンプリング)。しかし、有限なデータセットを相互排反に分割している限り、ある訓練セットでたまたま多かったラベルはそのときのテストセットでは少ないわけで、$acc_h$は過小評価されてしまう[←あっ、そうか...!]。
ふたつめ、cross-validation。[交差検証、交差確認、交差妥当化、いろんな訳語がありそうだ。どれが一番メジャーなのかなあ。以下ではCVと略記する]
まずは k-fold CV。$D$を$k$個のだいたい同じサイズの相互排他なサブセットに分割する。で、1個目, 2個目, ... を取り除きながら、残りのすべてを用いて分類器を構築し、取り除いたサブセットを分類する。で、$k$回を通じた正分類数をデータサイズで割る。ふむふむ。
えーと、事例 $\langle v_i, y_i \rangle$が属しているサブセット以外のすべてからなるデータセットを$D \backslash D_{(i)}$と書くことにして、
$acc_{CV} = (1/n) \sum_{\langle v_i, y_i \rangle \in D} \delta(I(D \backslash D_{(i)}, v_i), y_i)$
CVには他にもいろんなバージョンがある。分割の仕方を変えながら繰り返すとか、分割するときに層別するとか。各事例についてそれだけを取り出すという分割を行うのがご存知 leave-one-outである [原文にはleave-one-oneと書いてあるけど... なに、その犬みたいな名前...]。
データを一部取り除くことでデータは揺れるわけだけど、この揺れの下で分類器が安定しているのであれば、CV推定値は不偏だし、その分散は$acc_{CV} \times (1-acc_{CV})/n$となる。実際には、複雑な分類器生成手法は学習能力の上限に達しておらず、揺れに弱いかもしれない。foldの数が多いほうが安定性は高いと期待できる。さらにいえば、foldの数を動かしても分類器が安定しているならば、推定値の分散も変わらないといえる。
CVには次のような問題点がある。たとえばFisherのアヤメデータは3クラス, 各50ケース。当たるも八卦的な分類器構築メカニズムがあるとして、いま分類器の正確性をleave-one-outで推定すると、leaveされた一事例は常に少数派となり、どの分類器でも常にleaveされた事例以外の2クラスを予測値とする分類器となり、よってleaveされた事例は常に誤分類され、正確性は0, その分散は0となる。しかし分類器が安定しているわけではない。[←なるほどね...]
みっつめ、ブートストラップ。データから同サイズのデータを復元抽出する。
ある個体がある抽出で選ばれない確率は$(1-1/n)^n$, これは約0.368である。つまり選ばれる個体数の期待値は0.632nとなる。抽出された奴らを訓練セット、されなかった奴らをテストセットとする。で、訓練セットでの正確性を$acc_s$, テストセットでの正確性を$\epsilon 0_i$として
$acc_{boot} = (1/b) \sum_{i=1}^b (0.632 \epsilon 0_i + 0.368 acc_s)$
[あれれ? ここ、誤解しているかも... きちんと勉強しないと...]
ブートストラップにも問題点がある。分類器が完全なmemorizerで(枝刈りなしの決定木みたいなの)、データセットが完全にランダムで、2クラスだとしよう。どのブートストラップ標本でも、$acc_s$は1, $\epsilon 0$は0.5だ。ってことは$acc_{boot}$は0.68になる。ほんとは0.5なのに。このように、memorizer搭載の分類器生成メカニズムでは正確さの推定にバイアスが生じる。
後半は実験。データセットは7つ。決定木(C4.5)とナイーブ・ベイズ分類器を使う。hold-outでの正分類率を正として比較する。
結果。まずバイアスをみると、k-fold CVによる正確性推定値は k が小さいときに悲観的。ブートストラップはデータセットによって楽観的になることがある。
分散もあわせてみると、結局 kを10くらいにした k-hold CVがオススメである由。また分割の際に層別すると成績が良く成る由。へぇー。
実験結果も面白いけど、それより前半の概観が頭の整理になった。そうか、分類器生成メカニズム(この論文でいう Inducer)の性能と分類器の性能をきちんとわけて考えないと混乱するわけだ。勉強になりました。
論文:データ解析(2015-) - 読了:Kohavi(1995) 分類器の正確性の指標を比較する (ホールドアウト, CV, ブートストラップ)
2015年4月21日 (火)
Carbone, R., & Gorr, W.L. (1985) Accuracy of judgmental forecasting of time series. Decision Science, 16, 153-160.
「必ず読むこと」というタグがついているので、仕方なく読んだけど、なぜこれを読まなきゃと思ったんだろう... 全く思い出せない...
時系列の予測の際に、過去の時系列のチャートを見ながら主観で(フリーハンドで)予測するのと、まじめに統計的手法を使って予測するのとどっちがいいか、という実験。なんというか、風情があるというか、風情がありすぎるというか、風情しかないというか...
10本の時系列を用意。いずれも60時点以上あるそうだ。季節効果はあったりなかったりする。で、それぞれの右端をちょっと削る。
実験手続きは省略するが(「うちの大学のカリキュラムはこうなっているので」という話から始まる。超面倒)、要するに、学生の班に10本の時系列を渡し、削った右端を予測させるのである。手法は、Box-Jenkins法, Holt-Winters法, Carbone-Longini AEP filtering (なんだそれは)、そして主観。
結果。やっぱり統計的手法を使ったほうがよかったです。ただし統計的予測を主観でちょっと直すと良くなった場合もありました。
...そんなの、時系列次第なんじゃないの?!
まあいいや! 次に行きましょう次に!
論文:データ解析(2015-) - 読了: Carbone & Gorr (1985) 時系列予測ってフリーハンドでいいんじゃね?→よくなかった
2015年4月20日 (月)
たとえば調査票に5件法尺度項目が並んでいるとき、ばんばん両端にマルをつける人もいれば、真ん中のあたりにしかマルをつけない人もいる。これにはどうやら文化差もあるようで、「中国の人って両端につけやすいね」なんていう話も時々耳にする。
このような、項目内容とは無関係に生じる回答の傾向のことを、英語ではresponse styleというのだけれど、日本語ではなんというのだろうか。探しているのだけれど、なかなか出てこない。しばらく前にこの話題について紹介する記事を書いた際には「回答スタイル」と訳したのだが、「回答スタイル」で検索すると私の記事が上位に挙がってしまう。response styleに関して発見できた数少ない日本語文献のひとつは山岸・小杉・山岸 (1996, 社会心理学研究)で、この著者らは「応答傾向」と呼んでいるのだが、これもまた一般的な呼び方とはいいにくそうだ。ううむ...
Johnson, T.R. (2003) On the use of heterogeneous thresholds ordinal regression models to account for individual differences in response style. Psychometrika, 68(4), 563-583.
調査データにおける回答スタイルを統計的にモデル化するという論文。
回答スタイルの問題は個人的な関心事のひとつとしてフォローしているので、仕方なく目を通す次第だが、Psychometrikaの20頁の論文を読もうだなんて、ちょっとマゾヒスティックだなあ...
著者いわく、回答スタイル研究でもっとも注目されているのは順序カテゴリカル項目におけるextreme response style (k件法項目で両端につけやすい傾向, ERS) なので、それについてモデル化します、とのこと。ま、焦点をなにかに絞らないといけないのはわかるし、研究が多いのはERSとARS(acquiescence response style)だと思うので、この選択は自然であるように思う。それに、東アジアに住む身の上として最も気になるのはmidpoint responding (MPR) なので、その逆に相当する ERSのモデル化はありがたい。
なお、これまで提案されてきたERS対処策として以下がある由。
- カテゴリを潰す (Backman & O'Malley, 1984 POQ)
- カテゴリを増やす (Clarke, 2000 J.Soc.Behav.Personality; Hui & Triandis, 1989 J.CrossCulturalPsych. )
- モデル化する (Greenleaf, 1992JMR; Rossi, Gulula, & Allenby, 2001 JASA)
提案モデルは以下の通り。
対象者を$i=1,\ldots,n$とする。項目を$j = 1,\ldots,m_i$とする。各項目は$K$カテゴリの順序カテゴリカル項目である。回答を表す確率変数を$Y_{ij}=1,\ldots,K$、その実現値を$y_{ij}$とする。
回答の背後に連続潜在変数$Y^*_{ij}$を想定する。まずは固定的な閾値$\gamma = (\gamma_1, \ldots, \gamma_{K-1})'$でマッピングしよう。$\gamma_{k-1} < Y^*_{ij} < \gamma_{k}$のとき、そのときに限り$Y_{ij}=k$となると考える。
$Y^*_{ij}$が、全体レベルのパラメータ・ベクトル$\theta$と個人レベルのパラメータ・ベクトル$\zeta_i$の下で互いに独立であると仮定する。$\zeta_i$は$\theta$に依存するものとする。パラメータの事前分布を$h(\theta, \gamma)$, $\zeta_i$の密度関数を$g(\zeta_i | \theta)$として、確率モデルは
$h(\theta, \gamma) \prod_{i=1}^n g(\zeta_i | \theta) \prod_{j=1}^{m_i} P(\gamma_{y_{ij}-1} < Y^*_{ij} < \gamma_{y_ij} | \theta, \zeta_i, \gamma)$
ここまでは、まあ、わかりますわね。階層順序回帰モデルだ。
さて。回答スタイルの個人差を閾値の異質性として定式化する。
対象者$i$の閾値を$\gamma_i = (\gamma_{i1}, \ldots, \gamma_{i,K-1})'$とする。で、$\gamma_i$も$\theta$に依存するものとする。さあ、俄然ややこしくなってまいります。
まず、閾値はシンメトリカルだと想定する。つまり、たとえば「反対」「やや反対」「どちらでもない」「やや賛成」「賛成」の5件法だとして、「やや」が表す強さは反対でも賛成でも同じだと考えるわけである。順序カテゴリカル項目のすべてにおいて現実的な想定とはいえないが、中央が中立である両極尺度項目なら、まあ現実的な制約であろう。このように制約する理由はふたつ。(1)倹約性。(2)$Y_{ij}$のロケーション・パラメータへの共変量の効果を回答スタイルの個人差から分離できる。
以下、原文では一般化して書いてあるが、私が話についていけなくなってしまうので、以下では$K=5$に決め打ちして書き直します。えーと、カテゴリ$1,2,3,4$の右閾値が$\gamma_{i1}, \gamma_{i2}, \gamma_{i3}, \gamma_{i4}$である。ここで$\gamma_{i4}=-\gamma_{i1}>\gamma_{i3}=-\gamma_{i2}>0$と制約する。
これを閾値間の幅でシンプルに書き直す。このくだり、たぶん原文に誤植があると思うので、勝手に書き直しちゃうぞ。著者は
$\gamma_{i1} = - \delta_{i1} - \delta_{i2}$
$\gamma_{i2} = - \delta_{i1}$
$\gamma_{i3} = \delta_{i1}$
$\gamma_{i4} = \delta_{i1} + \delta_{i2}$
といいたいのだと思う。以下では$\delta_i = (\delta_{i1}, \delta_{i2})'$とする。
次に、個人レベルパラメータ$\zeta_i, \delta_i$のモデル化。
$(\zeta'_i, ln(\delta'_i))'$が多変量正規分布に iid に従うと考える[なぜ閾値の幅だけ対数に変換するのか、特に説明はない]。行列になっちゃうので式は省略するが、$\zeta_i$は平均$0$, 共分散行列$\Sigma_{11}$, $ln(\delta_i)$は平均ベクトル$\mu$, 共分散行列$\Sigma_{22}$, $ln(\delta_i)$を行、$\zeta_i$を列にとった共分散行列を$\Sigma_{21}$とする。こいつらをみんな$\theta$に叩き込むわけです。
というわけで、確率モデルは、
$h(\theta) \prod_{i=1}^n g(\zeta_i, \delta_i| \theta) \prod_{j=1}^{m_i} P(\gamma_{y_{ij}-1} < Y^*_{ij} < \gamma_{y_{ij}} | \theta, \zeta_i, \gamma)$
やれやれ、お疲れさまでした。
このモデルをどうやって推定するかという話が延々続くんだけど (もちろんMCMC)、そこはいまあまり関心がないので省略。
対抗モデルとしては:
- 回答スタイルがないモデル、すなわち$\Sigma_{22}=0$。
- Rossi et al.(2001)のモデル。閾値の比例性を仮定する(順序ロジットモデルとかでいえば、スケールパラメータだけが個人パラメータになる)。本モデルの特殊ケースとして捉えられる由
- 閾値に無情報事前分布を与えるモデル(でもシンメトリ性は想定する)。Johnson(1996 JASA, 1997 Stat.Sci.), Lenk, Wedel, & Bockenholt (2002 unpub.)というのが挙げられている。
- 本モデルと同じように$\delta_i$の周辺分布を対数正規分布とするんだけど、シンメトリ性を仮定しないモデル。Tutz & Hennevogl (1996, Comp.Stat.DataAnalysis) というのが挙げられている。
例を3つ。
例1, 簡単なシミュレーション。
データ生成モデルは、
$Y^*_{ij} = \beta_0 + \zeta_i + \beta_1 x_{ij} + \epsilon_{ij}$
ひとり9項目、$x_i = (-2, -1.5, -1, -0.5, 0, 0.5, 1, 1.5, 2)'$, $\beta_0=0$, $\beta_1=1$, $\zeta_i$と$\epsilon_{ij}$はiidに$N(0,1)$に従う。これを7件法に変換し、閾値を変動させる。閾値の分散を$\Sigma_{22}=cI$とし、$c$を$0$(つまり変動無し)、$\sqrt{0.5}, 1$の3通りを試す。$n=1000$。
分析側のモデルは、閾値に異質性を考える奴と考えない奴でそれぞれ推定。$\beta_0$, $\beta_1$, ランダム効果の分散$\sigma_{11}$がどうなるかを調べる。
結果。データ生成側で閾値を変動させたとき、分析モデルで閾値の異質性を考えておかないと、$\beta_1, \sigma_{11}$が過小評価される。(ここ、原文では$\beta_0$が過小評価されると書いてあるけど、表をみるとそうでもない。誤植ではなかろうか。)
例2はもっと複雑なシミュレーション、例3は実データの因子分析における適用。いずれも、やっぱ閾値の異質性を考えなきゃ駄目だよ、という主旨。疲れちゃったので読み飛ばした。
... ちゃんと読んでないけど、とりあえず読了にしておこう。このモデルって、Mplusで推定できないかなあ...
論文:データ解析(2015-) - 読了:Johnson (2003) 回答スタイルを階層回帰でモデル化
2015年4月16日 (木)
Greenberg, M., & McDonald, S. S. (1989) Successful needs/benefits segmentation: A user's guide. The Journal of Consumer Marketing, 6(3), 29-36.
題名の通り、ベネフィット・セグメンテーションについて実務家向けに教訓を垂れる。著者らはコンサル会社National Analystsの人々。この論文の冒頭ページによると、当時はブーズ・アレン・ハミルトン傘下だったらしい。へー。現在はこの論文の第二著者がCEOで、社名はNAXIONというらしい。へー。
まず概観。
セグメンテーションのタイプ。ベース変数の種類とその長所・短所の話。略。以下ではカテゴリへのニーズ(ベネフィット)によるセグメンテーションに話を絞ります。
ベネフィット・セグメンテーションにはperson-basedとoccasion-basedがある[←後者は実はperson-occasion segmentationのことを指している模様。つまり、オケージョンを分類するのではなく、ヒトxオケージョンの組み合わせを分類するセグメンテーション]。ベネフィット・セグメンテーションは頻繁に行われているが、適している場合とそうでない場合がある。たとえば過去ユーザとかスイッチャ―とか購買見込み者に注目している場合には単に購買行動でクロス表をとったほうがよい。云々。
ベネフィット・セグメンテーションの欠点。調査予算がかかる[←ネット以前の話なので切実だ]。先に定性調査やんなきゃいけないし、時間がかかる。セグメンテーションはステークホルダーが多いので意見調整が大変だし、せっかく作ったのに理解されず書庫にしまわれちゃうこともある[←はっはっはー]。良いセグメンテーションであっても、ターゲットセグメントへのマーケティング活動がうまくなかったら結局は意味がない。
ここのくだり、ちょっと面白かったのでメモ:
おそらくセグメンテーション・スタディは、それが[組織のなかで]目立つが故に病んでいくのである。セグメンテーション・スタディは組織を先導しようとし、それ故に非現実的な期待を生みだしがちである。セグメンテーション・スタディは[マーケティング戦略の]実行のための詳細なガイダンスをもたらすとは限らないし、創造性の代用品にもなれない。セグメンテーション・スタディの限界を知っている人は、あらゆる意味において、そのプロセスをうまく管理する責任を負う。すなわち、合理的な期待を形成し、セグメンテーションをコンパスではなく地形模型だとみなす人にそれが誤りだと気づかせなければならない。
後半は、セグメンテーションをめぐる5つの神話を挙げ、それらを否定する。
- 神話その1、「セグメントはリアルだ」。実際には、セグメントは実体ではない。ベネフィット・セグメントは心理空間における近似的な位置に過ぎない。完全に客観的でもなければ、統計的に信頼できるものでもない。たいていの人は複数のセグメントの要素を持っている。我々は個々人の独自性を扱うことができないので、態度のパターンと行動との関係を明確にするために類型を用いるのだ。
- 神話その2、「セグメンテーションから生まれる戦略は必然的にニッチ戦略となる」。実際には、マーケターは複数のセグメントをターゲットにできる。
- 神話その3、「良いセグメンテーション・スタディは斬新なポジショニングをもたらす」。実際には、選択肢はふつう事前にわかっており、セグメンテーション・スタディにできるのは、それに優先順位をつけるお手伝いである。
- 神話その4、「ターゲットでないセグメントによる製品購入はセグメンテーション概念の失敗を意味する」。実際には、ポジショニング戦略と市場における行動とが完全に一致するわけはない。
- 神話その5、「セグメンテーションはリサーチの終着点だ」。実際には、セグメンテーションによって、あるマーケティング戦略の結果をトラッキングするという新しい機会が得られる。だから調査項目の短縮版をつくったりするわけだ。
マネジリアル・インプリケーション。
- セグメンテーションのユーザ全員を最初から船に乗せておけ。自己防衛的なリサーチ政治学のようにみえるかもしれないけど[←吹き出してしまった]、多様な視点を反映させておくのはいいことだ。
- セグメンテーションにできることとできないことをきちんと区別しておけ。
- リサーチ会社のアプローチを理解してから契約しろ。会社によって哲学も手続きも全然違う。
- セグメントによい名前をつけることがすごく大事だ。がんばれ。
... 昔の文章ではあるのだが、とても面白かったです。特に後半が。
その上での、ただの感想なんだけど...
読んでいて実に実務家らしいなあと思ったのは、(1)セグメンテーションのベース変数としてどういう領域の変数を選ぶかという話と、(2)アプリオリに分類するかアポステリオリに分類するかという話と、(3)クロス表で済むのか多変量解析を用いるかという話とが、ともすればごっちゃに語られてしまっている点。これは過去経験に基づいて教訓を垂れる立場になってみれば極めて自然で、つまりベネフィット・セグメンテーションのような態度の領域の変数によるセグメンテーションは多変量解析を用いたアポステリオリな分類になるのが普通で、デモグラフィクスや購買・消費行動によるセグメンテーションはアプリオリな分類となりクロス表で十分なのが普通である。だからごっちゃになるのは間違ってないです。
でも、なんだかイライラするんですよね、本質的には違う水準の話を一緒にして語られちゃうと。書き手がどなたであれ、題名が"User's guide"であれ、学術誌の論文であるからには、ただの現象の類型化じゃなくて、世界を捉えるための整理された枠組みを提示してほしいな、なあんて...。
論文:マーケティング - 読了:Greenberg & McDonald (1989) ベネフィット・セグメンテーション・ユーザーズ・ガイド
Dickson, P.R. (1982) Person-situation: Segmentation's missing link. Journal of Marketing, 46, 56-64.
person-situationセグメンテーションという概念について理論的に整理する論文。消費者の多様性を理解する際には個人-状況の組み合わせを考えないといけないよね、という文脈でよく引用されると思う。実に33年前の論文だ。暇人といわれても仕方ないなあ。
著者いわく。person-situationセグメンテーションという考え方は新しくない。
- 70年代中盤、occasion-basedセグメンテーションという概念をNational Analysts社が導入している[←のちにDubow(1992)が事情をあきらかにしているけど、クライアントはコカ・コーラ。かの有名なCBLのご先祖様であるわけですね]。
- Sandell(1968, JMR)は消費状況をシナリオとして与える実験を行っている[←へえー!]。彼は状況によって飲料の選好が変わることを観察している。ただし、彼はニーズが変わったとは考えなかった(渇きが唯一の動因だと考えた)。
- Belk(1974 JMR; 1975 JCR): 食品や店舗の選択への使用状況の影響を示した。
- よく考えてみると市場がperson-situationで細分化されているという例は山のようにあるぞ。[←ああそうか、「若い女性向けの春物コート」ってperson-situationだなあ]。
理論的整理。
- あるグループのブランド・製品への態度と行動が、すべての使用状況のあいだで類似しているのなら、標準的なperson segmentationでよい。ヒトPのモノOへの評価を分解するという観点からいうと、これは評価をPないしPxOに分解しているわけだ。
- 製品に対する反応がすべてのヒトを通じて類似しており、ただ使用状況 S のみによって異なるのであれば、situation segmentationでよい。これは評価をSないしSxOに分解していることになる。
- 製品に対する反応がヒトと状況の組み合わせによって異なる場合は、person-situationセグメンテーションの出番である。これは評価をP, PxO, PxS, PxSxOに分解しているわけだ。こういうヒトx状況セグメンテーションの基盤はLewinの場理論、そして現代の相互作用論にある[← おっとぉ... 大きく出ましたね。後者としてEkehammer(1974, Psych.Bull.)を挙げている]。しかし消費者研究の文脈では、この2つの流れは結びつけて考えられてこなかった。
コトラーいわく、セグメンテーションには測定の容易性、接近可能性、実質性がなければならない。さて、person-situationセグメンテーションでは...
- ヒトと状況の組み合わせについてどうやって測定するか? 観察ないし想起であろう。問題は状況をどうやって定義するかだ。まず考えられるのは典型的な使用状況の設定である。網羅的に集めるのは大変だけど。
- 接近可能性は? まず、特定のperson-situationセグメントに接近できるケースは多い(ビールの使用状況のうち「仲間たちとTVでフットボールをみているとき」に接近したかったら、フットボールの番組でCMを出せばよい)。さらに、ターゲットであるヒトx状況の頻度が高いヒトに接近するという手もある。
- person-situationセグメントは実質的か? それはまあ、使用状況の頻度とその使用状況の重要性によりますわね。
従来よく用いられているサイコグラフィクス特性も、実はその人がおかれた状況にすぎないのかもしれないよ、というような話があって...[←パーソナリティ研究でいう一貫性論争みたいな話ですかね]
person-situationセグメンテーションの観点からいうと、セグメンテーションのベース変数には、person, situation, person-within-situationの3種類があることになる。この3種類が基盤となって、(下位レベルから順に)ベネフィット・セグメンテーション、製品知覚セグメンテーション、行動セグメンテーションが構築される。云々。
最後に手順の話。個々の使用状況における対象者のニーズなり製品知覚なり行動なりを調べ、使用状況とヒトの属性を縦横にとったマトリクスを書いてセルを埋めていく、という感じ[←おっと、つまりここではセグメントがアプリオリに決まるタイプのセグメンテーションを想定しているわけか]。著者ら曰く、すべての使用状況をリストアップする必要はない。
途中からまどろっこしくなって飛ばし読みになっちゃったんだけど、理論的整理のところは明解で、頭の整理になった。こうしてみると、いわゆるoccasion segmentationという表現は、(1)ヒトを単位として、製品への行動・態度を使用状況で分類するセグメンテーション、(2)ヒトx使用状況の組み合わせを単位として、行動・態度を分類するセグメンテーション、のどちらを指しているのかわからない、あまりよろしくない表現だということになると思う。
歴史的にみると、マーケティングの文脈では、消費者の選好の形成において個人特性と状況要因の交互作用に注目するという発想は70年代になって出てきた... という理解でいいのかしらん? 心理学の文脈でも、パーソナリティの状況一貫性論争は60年代末からだったし、クロンバックが適性処遇交互作用という概念を唱えたのもたしか70年代であった。面白いなあ。
論文:マーケティング - 読了:Dickson (1982) ヒトx状況のセグメンテーション
2015年4月15日 (水)
Hoek, J., Gendall, P., Esselemont, D. (1996) Market segmentation: A search for Holy Grail? Journal of Marketing Practice, 2(1), 25-34.
調べものをしていてたまたま見つけたもの。いちおう論文なんだけど、内容は啓蒙的エッセイという感じ。掲載誌もみたことのない雑誌で(CINIIによれば大学図書館所蔵は3館)、なんだかよくわからん。
市場セグメンテーションはマーケターの常識のひとつだ。でもビジネスがうまくいかなかった時、その原因はいろんな要因のせいにされるけど、「セグメンテーションが悪かったんだ」って反省することは少ないよね。ほんとはセグメンテーションなんて大概ろくな結果を招かないんじゃないの? と、煽りに近い前振りがあって...
セグメンテーションにおいてリサーチャーが決めないといけない事項をリストアップすると:
- ベース変数群。それをどう決めるか、良いガイドラインがない。アプリオリに決める場合と(年代とか収入とか)、ポストホックに決める場合があるが、前者はマーケティング刺激に対する反応がセグメント内で類似しているかどうかはっきりしないし、後者はアクションに活かせるかどうかわからない。
- 分析手法。手法も議論も山ほどあるが、ガイドラインがない。
- セグメント数とその組成。セグメント数は結局は主観的に決めるしかないし、全ケースを分類するか一部ケースは除外するかも主観的に判断するしかない。
- 解の妥当性。Calantone & Sawyer (1978 JMR) はデータをランダムにふたつにわけて分析し解が一致すればOKといっているが、真でないセグメントであってもデータ間で一致することはある。異なる手法間で結果が一致したときだけ信じろというアドバイスもあるが(Klastorin, 1983 JMR; ほか)、そんなの誰もやってない。
解釈上の諸問題:
- 安定性。縦断研究で、セグメンテーションに経時的な安定性がなかったという報告は多い。手法に問題があるのかもしれないが、個人が変動したって群として安定してれば問題ないじゃんという意見もあるし、市場は変化するのが当然じゃんという意見もある。行動の予測子となる変数がベース変数群に入っていることが大事。
- 意思決定をどう支援するか。たとえば、ターゲットセグメントをどう決めるか。
結論。セグメンテーションには主観的判断が多く含まれる。リサーチャーはリサーチの方向性と知見を事前に規定している暗黙的な理論の存在に気が付いていない。必要なのはデータ解析のテクニックではなく、セグメンテーションのためのデータ解析戦略を構築することなのに、リサーチャーはそれに気が付かない。
マネージャーのみなさん、セグメントの妥当性が確認されるまで結果を信じてはいけません。妥当性が確認されたとしてもアクションは自分で決めないといけません。
ううむ。。。
エビデンスに基づき意思決定を支援するという活動に対し、そこには主観的判断が入っているよね? 客観的でないよね? と指摘しても、その活動の価値を下げることにはならないし、改善する必要があるとも言い切れないのではないかと思う。たとえば、その優れた主観的センスを酒造りに生かしてはいるが、実はさまざまな測定機器を駆使しないと手も足も出ない、という新世代型の杜氏さんだっているかもしれない。主観とエビデンスは相互作用しながらひとつのシステムとして機能する。その機能が優れていればなんの問題もないだろう。
この論文の話題に即して言うと、セグメンテーションのプロセスには、なるほど、さまざまな主観的判断が入っている。だからといって、そのことがセグメンテーションという活動の限界となっているとは言い切れないと思う。著者らは「マーケターはセグメンテーションの結果を懐疑的に捉えないといけない」と仰るし、まったくその通りだと思うけど、そのことと主観的要素の有無とは別の話題だ。正しい主観的判断をうまく引き出せているおかげで、信頼できる結果が得られているかもしれない。あたかも自動販売機のように自動化されたセグメンテーション手続きが開発されたとしても、そのアウトプットはやはり懐疑的に捉えないといけないかもしれない。
だから、著者らの主旨を勝手に汲み取ると、先生方が本当に主張しないといけないことは、(1)セグメンテーションは主観的な判断を含んでおり(2)「それゆえに」失敗しやすいのだ、ということなのではないかと思うのである。後段を説得的に示すのは、もちろん難しいことではあろうけれど...
論文:マーケティング - 読了:Hoek, Gendall, & Esselemont (1996) セグメンテーションという見果てぬ夢
2015年4月14日 (火)
宮永孝(2014) パリ・コミューンをみた日本人. 社会志林 60(4), 1-51.
ルフェーブル「パリ・コミューン」をめくっているのだけれど全然頭に入らず、参ったなぁ、先に予備知識をつけた方がいいのか... と思いながらなんとなくみつけたもの。著者は歴史学者で、掲載誌は法政大の紀要らしい。
まずパリ・コミューンのいきさつについて時間軸にそって紹介した後、当時パリにいたことがわかっている日本人たちを紹介。留学生約20名(一番有名なのは西園寺公望)のほかにも、前田正名という官僚が籠城中のパリにいたのだそうだ。また、直前には普仏戦争の観戦に来た日本の軍人たちがパリに入っていた由(通訳は中浜ジョン万次郎だったそうだ。へー)。というわけで、彼らが残した記録を紹介する内容であった。
論文:その他 - 読了:宮永(2014) パリ・コミューンをみた日本人
2015年4月10日 (金)
Jenkins, M., & McDonald, M. (1997) Market Segmentation: Organisational Archetypes and Research Agendas. European Journal of Marketing, 31(1), 17-32.
ちょっと気になることがあって目を通した。論文自体は手に入らなかったが、ネットに落ちてたdraftで読んだ。
マーケット・セグメンテーションの実践を類型化する(記述的な)フレームワークを提供します、という論文。セグメンテーションに関する資料をみていると、横軸に組織へのセグメントの統合、縦軸に組織の顧客駆動性をとったマトリクスが載っていることがあるけど、その元になった論文らしい。
まず、セグメンテーションの理論的な「べき」論と実践とはかなりちがうよね、という話があって...
4つの事例を紹介 (きちんとした事例研究というよりは逸話の紹介)。
- 国際的航空会社。市場を主に地域でわけて、さらにファースト/エコノミークラスにわけて捉えている。つまり、セグメンテーションは組織の内部構造に規定されている。
- 肥料メーカー。市場を牧草用と耕作穀物用に分けている。つまり、セグメンテーションは組織の内部構造を横断しているが製品に規定されている。
- 銀行。顧客DBを基に複雑なセグメンテーションを構築しているが、製品そのものはそれとは無関係に開発されている。つまり、セグメンテーションは顧客を起点にしているが、マーケティング活動の機能に限定されていて、組織が外部世界をどう捉えるかという点には影響していないし、顧客に対して本当にインパクトを持っているプロセスには影響を与えていない。
- Burton Group [←英国の服飾小売業者らしい。現在はArcadia Groupというらしい。TOPSHOPというのがここのブランドのひとつで、ラフォーレ原宿にも店舗があったんだけど、この一月に突然閉店し撤退しちゃったらしい]。各ブランドは固有のセグメントを持つだけでなく、固有の組織を持ち、そのブランドの生存に集中している。つまり、セグメンテーションは組織構造を規定しており、従業員のパースペクティブに埋め込まれている。
というわけで、セグメンテーションの実践にはいろいろあって、次の2軸で整理できる。
- 顧客駆動的か。上の例でいうと、銀行とアパレルは、コトラー先生云うところの顧客グループとしてのセグメントに焦点を当てている。
- 組織への統合性。肥料メーカーとアパレルにとって、セグメントは単なる販売ターゲットとかじゃなくて、組織の本質的な一部分となり、戦略の基盤となっている。
というわけで、セグメンテーションの組織論的な元型(archetype)として次の4つを考えることができる:
- Sales Based セグメンテーション。顧客駆動的でなく、組織に統合されていない。例: 航空会社。
- Structural セグメンテーション。顧客駆動的でないが、組織に統合されている。例: 肥料メーカー。
- Bolt onセグメンテーション。顧客駆動的だが、組織に統合されていない。例:銀行。
- Strategic セグメンテーション。顧客駆動的で、組織に統合されている。
インプリケーション。これは記述的枠組みであって、どのタイプのセグメンテーションが望ましいのかは別の問題。今後の研究課題としては...
- 組織の構成がセグメンテーションに与える影響。
- 組織文化・マインドセットがセグメンテーションに与える影響。
- 産業文化・マインドセットがセグメンテーションに与える影響。
- 環境のダイナミクスや組織の変化によって、企業のセグメンテーションがある元型から別の元型に移動することがあるのではないか。
... イントロにこんなことが書いてあって、すごく面白かった。
この[従来の理論的な]議論は以下の点を想定している。まず、セグメントが客観的で同定可能な実在であり、すべてのマネージャーと組織が、それらの「世の中に」存在するセグメントを利用できる、という想定。そして、セグメンテーションとはマネージャーが市場における自らの効率性を最大化するために取り組むプロセスなのだという想定である。これらの想定に対し、2つのレベルで異議を申し立てることができる。第一に、セグメンテーションへのこうしたアプローチは、組織のケイパビリティや構造について明示的に考慮していない。[...] 第二に、セグメンテーションは実証的分析に先行して行われるプロセスというわけではなく、むしろ市場空間の見る上でのひとつのパースペクティブだとみなしうる場合もある。この観点では、組織は市場を多様なグループに分けることを通じて、自らの環境についての「理解」を得ようとしているのだということができる。
二点目を読んで大喜び。そうそう!そうですよね!
ときどき、消費者を統計的に分類しようとする私に対して「『実務的』なセグメンテーションには同定可能性と接近可能性と利益可能性と実行可能性が必須だ」なあんて、コトラーの守護霊インタビューのようなことを仰る方がいらっしゃるんですけど、接近可能性や実行可能性がない分類でも、消費者の多様性を理解するための視点として十分に役に立つことがある。それでその場の用が足りてしまうことも少なくない。さらに、その場の用が足りるかどうか、実際に分類してみせるまでは誰も判断できないことさえある。
別の云い方をすると、実務家が語る実務なるものをあまり信じてはいけない。実務というのは案外実務的ではない。優れた人であっても、自分が本当に行っていること、自分が本当に求めているものは、案外わからないものなのである。
ところで...
この論文は、マーケティング実践を記述的に類型化するという視点から組織論に踏み込んでいるところが面白いんだけど、マーケティングについて規範的に語る中で「組織かくあるべし」と踏み込む人も多い。ああいうマーケティング視点からの組織類型って、経営学的にもなんらかの実証的な対応物があるもんなんですかね? たとえば、企業XXX社のデータを集めて調べたところ、消費者視点に基づき顧客セグメントに密接に対応する組織を構築している企業のほうが収益性が高かったですとか、持続的に成長してましたとか、従業員の抜け毛が少なかったですとか(すいません冗談です)、そういう対応関係があったりするのだろうか? 申し訳ないですが、マーケティングの観点から見た組織のありかたの望ましさは、実は企業の業績や運命そのものにはあまり関係していないのではないか、マーケティング学者の「云いっぱなし」的組織論に過ぎないんじゃないか、という素朴な疑念を拭えない...。
いや、それはそれで別にいいんですけどね。「云いっぱなし」な理念型を提出するのも大事な仕事なのかもしれませんし、経営的なインパクトはとても小さいけどマーケティングの文脈では意義があるという概念だってあるのかもしれませんし。単なる好奇心であります。
論文:マーケティング - 読了:Jenkins & McDonald (1997) セグメンテーションの組織論的類型
2015年4月 9日 (木)
退屈 息もつかせぬその歴史
[a]
ピーター・トゥーヒー / 青土社 / 2011-09-21
西洋古典学者が、「退屈」をめぐる古今東西の文献を渉猟して語る、なんというか、格調高ーい読み物であった。
パリ・コミューン(上) (岩波文庫)
[a]
H.ルフェーヴル / 岩波書店 / 2011-08-19
先日から読んでいるのだが、予備知識がなさすぎて、さっぱり頭に入らない... 参ったな...
渡辺京二傑作選① 日本近世の起源 (新書y)
[a]
渡辺 京二 / 洋泉社 / 2011-07-06
督促OL 修行日記 (文春文庫)
[a]
榎本 まみ / 文藝春秋 / 2015-03-10
ビスマルク - ドイツ帝国を築いた政治外交術 (中公新書)
[a]
飯田 洋介 / 中央公論新社 / 2015-01-23
袁世凱――現代中国の出発 (岩波新書)
[a]
岡本 隆司 / 岩波書店 / 2015-02-21
シリア アサド政権の40年史 (平凡社新書)
[a]
国枝 昌樹 / 平凡社 / 2012-06-17
東京最後の異界 鶯谷 (宝島SUGOI文庫)
[a]
本橋 信宏 / 宝島社 / 2015-02-05
境界の民 難民、遺民、抵抗者。 国と国の境界線に立つ人々
[a]
安田 峰俊 / KADOKAWA/角川書店 / 2015-02-28
以前、ウイグル族の世界的に高名な指導者が靖国神社に参拝していて、いったいなにがどうなっているのだろうと思ったんだが、この本のおかげで少し事情がわかった。悲しい話だ...
ノンフィクション(2011-) - 読了:「境界の民」「パリ・コミューン」「退屈」「日本近世の起源」「督促OL 修行日記」「ビスマルク」「袁世凱」「シリア」「東京最後の異界 鶯谷」
〈階級〉の日本近代史 政治的平等と社会的不平等 (講談社選書メチエ)
[a]
坂野 潤治 / 講談社 / 2014-11-11
著者によれば、総力戦体制の下である種の社会的平等が実現したの事実だが(小作農解放とか)、そこに因果関係があるかどうかは別の問題だ、とのこと。そうかー。
レジより愛をこめて~レジノ星子~ (ワイドKC モーニング)
[a]
曽根 富美子 / 講談社 / 2015-02-23
食い詰めてスーパーのレジ打ちを始めた50代独身女性のエッセイマンガ。週刊モーニングで連載が始まったとき、いっけん素人っぽいようにみえてスラスラとよめてしまう練達ぶりに、この作者はいったいどういう経歴の人なのだろうかと思ったのだが、末尾につけられた他社の過去作品広告をみて仰天。曽根富美子って、あの曽根富美子!? 寡作ではあるが、自閉症、家族問題、戦後史などのハードな題材の作品で知られる大ベテランだ。
この作家さんが慣れないレジ打ちを... となんともいえない気持ちになったが、作品自体は、ちょっとほろ苦いけど明るく楽しい良作であった。残念ながら巻号はついていないので、続きはなさそうだが、誰にでもお勧めできる素敵なマンガである。
江戸の告白 (モーニング KC)
[a]
昌原 光一 / 講談社 / 2015-02-23
闇金ウシジマくん 33 (ビッグコミックス)
[a]
真鍋 昌平 / 小学館 / 2015-02-27
文鳥様と私15 (LGAコミックス)
[a]
今 市子 / 青泉社 / 2015-03-20
三代目薬屋久兵衛 1 (FEELコミックス)
[a]
ねむ ようこ / 祥伝社 / 2015-03-07
かくかくしかじか 1
[a]
東村 アキコ / 集英社 / 2012-07-25
かくかくしかじか 2
[a]
東村 アキコ / 集英社 / 2013-05-24
かくかくしかじか 3 (愛蔵版コミックス)
[a]
東村 アキコ / 集英社 / 2014-01-24
あんまり関心がなかったんだけど、昨年大きな賞を取ったので、試しに手に取った。読んで納得。これは泣くわ... 続きを読むのが怖いくらいだ。
コミックス(2015-) - 読了:「レジより愛をこめて」「江戸の告白」「闇金ウシジマくん」「文鳥様と私」「かくかくしかじか」「三代目薬屋久兵衛」
不器用な匠ちゃん 6 (MFコミックス フラッパーシリーズ)
[a]
須河篤志 / KADOKAWA/メディアファクトリー / 2015-01-23
奥手な20代男女の恋愛を描いたコメディ、完結巻。
あとかたの街(3) (KCデラックス BE LOVE)
[a]
おざわ ゆき / 講談社 / 2015-03-13
昭和元禄落語心中(7) (KCx)
[a]
雲田 はるこ / 講談社 / 2015-03-06
喰う寝るふたり 住むふたり 5 (ゼノンコミックス)
[a]
日暮 キノコ / 徳間書店 / 2015-03-20
聖☆おにいさん(11) (モーニング KC)
[a]
中村 光 / 講談社 / 2015-02-23
エバタのロック 2 (ビッグコミックス)
[a]
室井 大資 / 小学館 / 2013-04-30
あさひなぐ 14 (ビッグコミックス)
[a]
こざき 亜衣 / 小学館 / 2015-02-27
薙刀を題材にしたスポーツマンガ。しょせんは高校生の部活の話であって、私にとってはホントにどうでもいい話なのだが、しかし面白い。物語というのは不思議なものだ。
コミックス(2015-) - 読了:「昭和元禄落語心中」「あとかたの街」「喰う寝るふたり住むふたり」「不器用な匠ちゃん」「聖おにいさん」「エバタのロック」「あさひなぐ」
女子攻兵 6 (BUNCH COMICS)
[a]
松本 次郎 / 新潮社 / 2015-03-09
巨大な女子高生型のロボット(なぜ女子高生なのかはさっぱりわからない)に乗り込み、わけのわからない敵と絶望的な戦争を続ける男たちの物語。とても癖のある作品なので、好みは大きく分かれると思うけれど、いま一番続きが気になるマンガ。
アルテ 2 (ゼノンコミックス)
[a]
大久保 圭 / 徳間書店 / 2014-11-20
アルテ 1 (ゼノンコミックス)
[a]
大久保圭 / 徳間書店 / 2014-04-19
雰囲気からして版元はエンターブレインだと勘違いしていたのだが、よくみたら、これ月刊コミックゼノンだ... これに限らず、最近は「マンガが好きな人が好きそうなマンガ」が増えてきたなあ、という気がする。
ラブやん(21) (アフタヌーンKC)
[a]
田丸 浩史 / 講談社 / 2015-03-23
オールラウンダー廻(16) (イブニングKC)
[a]
遠藤 浩輝 / 講談社 / 2015-03-23
事件記者トトコ! 3巻 (ビームコミックス)
[a]
丸山 薫 / KADOKAWA/エンターブレイン / 2015-03-14
おやこっこ 上巻 (イブニングKC)
[a]
武田 一義 / 講談社 / 2015-03-23
おやこっこ 下巻 (イブニングKC)
[a]
武田 一義 / 講談社 / 2015-03-23
コミックス(2015-) - 読了:「事件記者トトコ!」「おやこっこ」「女子攻兵」「オールラウンダー廻」「アルテ」「ラブやん」
甘々と稲妻(4) (アフタヌーンKC)
[a]
雨隠 ギド / 講談社 / 2015-03-06
なんというか、このマンガを繰り返し読んでしみじみ心温まる思いをしていると、私って結構いい人だなあ、という気がしてきますね...
孤食ロボット 2 (ヤングジャンプコミックス)
[a]
岩岡 ヒサエ / 集英社 / 2015-03-25
これも食をテーマにしたマンガ。最近のひとつのトレンドではないかと思う。
ごほうびごはん 1 (芳文社コミックス)
[a]
こもとも子 / 芳文社 / 2015-02-16
めしばな刑事タチバナ 17 (トクマコミックス)
[a]
坂戸佐兵衛,旅井とり / 徳間書店 / 2015-03-31
ちょっと毛色が違うけど、この2冊も食関連だ。あれ? ひょっとして、私が最近こういうマンガばかりを手に取っているということだろうか? そうではないと思うけど...
イノサン 8 (ヤングジャンプコミックス)
[a]
坂本 眞一 / 集英社 / 2015-03-19
BLUE GIANT 5 (ビッグコミックススペシャル)
[a]
石塚 真一 / 小学館 / 2015-02-27
ちおちゃんの通学路 1 (MFコミックス フラッパーシリーズ)
[a]
川崎 直孝 / KADOKAWA/メディアファクトリー / 2014-09-23
ちおちゃんの通学路 2 (MFコミックス フラッパーシリーズ)
[a]
川崎 直孝 / KADOKAWA/メディアファクトリー / 2015-03-23
高校への登下校に焦点を当てたドタバタコメディ。面白い発想だ。第一話が最も面白い。逆にいうと、どこまで続けられるのかしらん、と...
コミックス(2015-) - 読了:「BLUE GIANT」「甘々と稲妻」「イノサン」「孤食ロボット」「めしばな刑事タチバナ」「ごほうびごはん」「ちおちゃんの通学路」
最近呼んだ本。最近はあまり本を読めていないのだが、記録もしばらくさぼっていたので、たまってしまった。
わがままちえちゃん (ビームコミックス)
[a]
志村 貴子 / KADOKAWA/エンターブレイン / 2015-03-25
思春期の少女の葛藤を題材にした、一種の心理サスペンス。志村貴子さんってこんなに巧かったっけ? とびっくり。
娘の家出 2 (ヤングジャンプコミックス)
[a]
志村 貴子 / 集英社 / 2015-02-19
鉄楽レトラ 6 (ゲッサン少年サンデーコミックススペシャル)
[a]
佐原 ミズ / 小学館 / 2015-02-12
完結巻。良いマンガであった。
健康で文化的な最低限度の生活 2 (ビッグコミックス)
[a]
柏木 ハルコ / 小学館 / 2015-01-30
いちえふ 福島第一原子力発電所労働記(2) (モーニング KC)
[a]
竜田 一人 / 講談社 / 2015-02-23
乙嫁語り 7巻 (ビームコミックス)
[a]
森薫 / KADOKAWA/エンターブレイン / 2015-02-14
いぬやしき(3) (イブニングKC)
[a]
奥 浩哉 / 講談社 / 2015-02-23
コミックス(2015-) - 読了:「わがままちえちゃん」「娘の家出」「鉄楽レトラ」「健康で文化的な最低限度の生活」「いちえふ」「乙嫁語り」「いぬやしき」
2015年4月 1日 (水)
消費者調査関連の仕事をしていると、調査データの確率ウェイティング (いわゆる「ウェイトバック集計」)に関する話題が出ることがある。なぜか周期的に巡ってくるような気がする。ものすごく大事なわけではないけどそこそこ大事な話題であり、一般的な話題の割にはきちんとした知識を持つ人が少なく、お金にならない割にはものすごく面倒くさい話題である。
別に専門家になるつもりはないのだけれど(つもりがあっても能力的に無理だ)、それなりの理論武装はしておきたいので、なにか機会があるたびに、適当な関連資料に目を通すことにしている。まとめて読むのはつらい話題だし。
Kalton, G., & Flores-Cervantes, I. (2003) Weighting Methods. Journal of Official Statistics, 19(2), 81-97.
というわけで、誰かがお勧めしていた、ウェイト値の作り方についてのレビュー論文。
ウェイティングには一般に次の3つのステージがある。
- 抽出フレームに照らしたウェイト値の決定。これは単純で、抽出確率の逆数に比例した値であればなんでもよい。この論文のテーマではない。
- 無回答の調整。なんらかの補助情報をつかって、回答者・無回答者を通じて似た人をまとめ、無回答者の分だけ回答者のウェイトを増やす。
- 事後層別。たとえば、性別x年代の既知の分布に調査結果をあわせる、というような。
ステージ2, 3の主目的は非回答・非カヴァレッジによるバイアスの除去である。しかしウェイトの分散が増し推定値の精度が下がってしまう。無回答の場合には、個体$i$のウェイト値を$w_i$として$F=1 + CV(w_i)$を評価することが多い(以下、分散インフレーション・ファクターと呼ぶ)。
さて、無回答の調整や事後層別のためのウェイト値をどうやって作るか。
例として、補助変数A(4水準)とB(3水準)があって、標本の同時分布(AxBのクロス表のことね)と母集団の同時分布がわかっているとしよう。さあいくぞ!歯を食いしばれ!!
- セル・ウェイティング。3x4=12個のセルそれぞれについて、標本と母集団の比を求める。たとえばあるセルのサイズが標本で20, 母集団で80だとしたら、そのセルのウェイトは4.0。
無回答の調整の場合でいえば、この方法の背後には、あるセルの無回答者の値はそのセルの回答者の値で表現されている、という発想がある。回答の生起確率は同一セル内では同じだと思っているわけで、欠損値の分析でいうところのMARを仮定しているわけである。セル・ウェイティングはMARしか仮定していないのが特徴。各セルを通じた無回答の発生確率についてはなんの想定も置いていない点に注目せよ。
この方法の欠点は、いうまでもなく、ウェイト値の分散が大きくなっちゃうという点である。 - レイキング。反復比例フィッティングで周辺分布だけを合わせる。まず標本側の行和を母集団側の行和に合わせ、次に標本側の列和を母集団側の列和に合わせ... というのを収束するまで繰り返すわけである。
無回答の調整の場合でいえば、この方法の背後には、(1)回答確率はセル内では等しい、(2)あるセルの回答確率はその行の効果とその列の効果の積だ、という発想がある。
この手法の良い点は、ウェイト値の分散が小さいという点だが、その代償に(2)の仮定を受け入れているわけで、それがよいことかどうかは良く考える必要がある。[←なるほどー]
なお、ここで述べたのはraking法のひとつであるraking ratio法である。より一般的な定式化についてはDeville et al.(1993 JASA)をみよ。 - 線形ウェイティング。これも補助変数の周辺分布だけを合わせる方法だが、合わせ方がちょっとちがう[詳細は書いてない。上のDeville et al.を読むといいらしい]。負のウェイトが生じてしまうことがあるのが欠点。
- GREGウェイティング(GREGとは一般化回帰推定量の略)。補助変数の分布を合わせるんじゃなくて、なにかの量的変数のウェイティングした標本推定値を母集団に合わせる。たとえば、Aの4水準(A1, A2, A3, A4)の代わりに1,2,3,4という値を持つ量的変数A、Bの3水準(B1,B2,B3)の代わりに1,2,3という値を持つ量的変数Bがあるとしよう。で、標本におけるAのウェイティングしていない平均が2.5, Bのウェイティングしていない平均が2.27となり、いっぽう母集団ではAの平均が2.63, Bの平均が2.24になったとしよう。ウェイティングした平均が2.63, 2.24になるようなウェイトを考えましょう、という発想である。
- ロジスティック回帰ウェイティング。これは無回答調整から生まれた発想で、無回答の確率をA, Bでモデル化し、そのモデルで予測された回答確率の逆数をウェイト値にする。A, Bが両方カテゴリカルだったらレイキングに近いウェイト値になる。でも量的変数も扱えるし、交互作用項をいれるのもレイキングより簡単である。ただし、周辺分布が母集団と一致するとは限らない。
- セル・ウェイティングと他の手法の混合。たとえば、サイズがある閾値より大きなセルについてはセル・ウェイティングし、残ったセルについては大きなセルを取り除いた上でレイキングする、とか。
さて、ウェイト値をつくった結果、分散インフレーションファクター$F$が大きくなっちゃったときはどうすればよいか。
一般には、極端なウェイト値をトリミングしたり(ウェイト値の上限を定め、それを超えたらそれに切り詰める)、セルを併合したりするわけだが、どちらも副作用がある。つくったウェイト値のなかで極端な奴を修正するより、最初から極端な奴がでないようにウェイト値をつくったほうが良い。そういう方法を提案した人がいて(ロジット法とトランケーテッド線形法)、CALMARというSASマクロがある。
補助変数がいっぱいあって、選択したいときにはどうすればいいか。
無回答調整の場合で考えると、要するに、セル間で回答確率が異なりかつ集計対象変数の分布も異なるようなセルがほしいわけである。集計対象の変数はふつう一杯あるから、結局は回答有無を説明するロジスティック回帰なり決定木なりをつくるときにどんな変数を選ぶか、という話に帰着する。
いっぽう事後層別の場合では、そもそも補助変数を選ぼうという話にならない(なんらかの補助変数についての外的な目標分布があって、それに合わせようとするわけだから)。むしろ、集計対象の変数とその補助変数との関係が強いかどうかが問題になる。
後半は事例紹介: 米農業省のNational Food Consumption Surveyと米センサス局のThe Survey of Income and Program Participation. 略。
まとめ。
ウェイティング手法はいろいろ発展しているが、いずれにせよ、非カバレッジが大きい状況で「ウェイティングで目標分布に合わせよう」なんてことをやっていると精度が下がっちゃう。ウェイト値の分散を大きくしないこと。
ウェイト値の作り方はいろいろあるけど、まあどれも似たようなものである。それよか補足変数の選び方のほうが大事だ。さらに、ウェイト値の作り方の背後にある統計モデルに注意しなさい。
推定値の分散について考える際には、ウェイティングの効果を定数だと思わないこと[←おおっと、これはつまりSPSS Data Collection的なやり方に喧嘩を売っているわけね...]。ジャックナイフ推定とかでいちいち検討するように。
勉強になりましたですが... GREGウェイティングっていまいちピンとこないなあ。よっぽど暇になったら勉強しよう。
論文:データ解析(2015-) - 読了:Kalton & Flores-Cervantes (2003) 「ウェイトバック集計」のためのウェイト値のつくりかた