elsur.jpn.org >

2018年7月13日 (金)

Wall, M.M. (2004) A close look at the spatial structure implied by the CAR and SAR models. Journal of Statistical Plannning and Inference, 121, 311-324.
 仕事の合間に読んだ奴。空間計量経済学でいうところのSARモデル(同時自己回帰モデル)とCARモデル(条件つき自己回帰モデル)は、特に不規則格子に適用したとき、意外な相関構造をもたらすよ、という論文。
 なんの気なしに読み始めたら、これがほんとに面白くって... 最後まで一気読みしてしまった。

 説明の都合上、まずはモデルの定式化から。
 $\{A_1, \ldots, A_n\}$が$D$の格子になっているとする(つまり、$D$を重なりなく完全に分割しているとする)。$\{Z(A_i): A_i \in (A_1, \ldots, A_n)\}$をガウス過程とする。
 [以下、本文ではいちいち$Z(A_i)$と書いているけど、うざいので$Y_i$と略記する]

 SARモデルとは、
 $Y_i = \mu_i + \sum_j^n b_{ij} (Y_j - \mu_j) + \epsilon_i$
 $\mathbf{\epsilon} = (\epsilon_1, \ldots, \epsilon_n)' \sim N(\mathbf{0}, \mathbf{\Lambda})$
ただし$\mathbf{\Lambda}$は対角行列。$\mu_i = E[Y_i]$。$b_{ij}$は定数で($b_{ii}=0$)、既知でも未知でもよい。[この定式化だと、空間自己回帰パラメータは$b_{ij}$のなかに入ってるわけね]
 $n$が有限なら、$\mathbf{Y} = (Y_1, \ldots, Y_n)'$, $\mathbf{\mu} = (\mu_1, \ldots, \mu_n)'$, $\mathbf{B} = (b_{ij})$として
 $\mathbf{Y} \sim N(\mathbf{\mu}, (\mathbf{I} - \mathbf{B})^{-1} \mathbf{\Lambda} (\mathbf{I} - \mathbf{B})^{-1'})$
である。$\mathbf{B}$は、隣接行列を$\mathbf{W}$として$\mathbf{B} = \rho_s \mathbf{W}$とすることが多い。この場合
 $\mathbf{Y} \sim N(\mathbf{\mu}, (\mathbf{I} - \rho_s \mathbf{W})^{-1} \mathbf{\Lambda} (\mathbf{I} - \rho_s \mathbf{W})^{-1'})$
である。

 CARモデルでは、$Y_{-i} = \{Y_j: j \neq i\}$と書くとして
 $Y_i | Y_{-i} \sim N \left( \mu_i + \sum_j^n c_{ij} (Y_j - \mu_j), \tau^2_i \right)$
ただし、$\mu_i = E[Y_i]$。$c_{ij}$は定数で($c_{ii}=0$)、既知でも未知でもよい。
 $n$が有限なら、$\mathbf{C} = (c_{ij})$とし、対角に$\tau_i^2$を持つ対角行列を$\mathbf{T}$として
 $\mathbf{Y} \sim N(\mathbf{\mu}, (\mathbf{I} - \mathbf{C})^{-1} \mathbf{T})$
である。$\mathbf{C}$は、隣接行列を$\mathbf{W}$として$\mathbf{C} = \rho_c \mathbf{W}$とすることが多い。この場合
 $\mathbf{Y} \sim N(\mathbf{\mu}, (\mathbf{I} - \rho_c \mathbf{W})^{-1} \mathbf{T})$
である。

 隣接行列$\mathbf{W}$の要素$w_{ij}$は、隣だったら1, そうでなかったら0とすることが多いが、行の和を1にしたり、もっといろいろ工夫することもある。行で基準化する理由は、近接地域の数が変動するときに内的整合性が失われるからである。
 なお、CARモデルでは$\mathbf{W}$と$\mathbf{T}$が$w_{ij} \tau_j^2 = w_{ji} \tau_i^2$を満たさなければならない。
 
 なお、CARをもっと限定したICAR(intrinsic CAR)モデルもあるが、ここでは扱わない。

 準備はできた。ここからが本題。

 米48州のSAT言語得点平均をモデル化してみる。共変量は受験率とし(中部の州は受験率が低く得点平均が高い)、二次の項もいれる。
 誤差項について次の4つのモデルを比較する。

  • SARモデル。隣接行列は行基準化し、$\mathbf{\Lambda} = \sigma_s^2 diag(1/w_{i+})$とする(そうしなくてもいいんだけど、CARモデルとの比較のため)。
  • CARモデル。隣接行列は行基準化し、$\mathbf{T} = \sigma_c^2 diag(1/w_{i+})$とする。
  • 指数バリオグラムモデル。州$i, j$の重心間距離を$d_{ij}$とし、共分散を$\sigma_{g1}^2+\sigma_{g2}^2 \exp(-|d_{ij}|/(range))$とする。
  • IIDモデル。分散は共通、共分散なし。

 誤差項の予測値を比較すると、SARとCARはだいたい同じで(CARのほうが分散が大きい)、バリオグラムモデルとはずいぶんちがう。よくみると、SARとCARでは隣接している2州のあいだでも相関がちがっている[ああそうか、州の形が不規則だからね]。バリオグラムモデルの場合は経験バリオグラムをみれば残差の空間構造が適切かどうかチェックできるが、SARとCARでは共分散に体系的な構造がなく、それが空間構造の記述として適切かどうかを調べる方法がないのである。[←なるほどー]

 こんどは、同じ米48州の隣接行列$\mathbf{W}$を使って、SARとCARの共分散行列が$\rho_s, \rho_c$とともにどう変わるかを調べてみよう。つまりこれはデータと関係ない話である。
 $\rho_s$と$\rho_c$がとりうる範囲は、$\mathbf{W}$の固有値を$\omega_i$として、$i=1, \ldots, n$について$\rho_s \omega_i < 1$, $\rho_c \omega_i < 1$である、と通常考えられている。厳密にいうと、SARモデルの場合には$\rho_s \neq 1/\omega_i$が満たされていればよいのだが、$\rho_s$の解釈が難しくなる。[...このくだり、理解が追いつかない。あとで勉強しておこう。Haining(1990)という教科書がreferされている]
 まあとにかく、この米48州の隣接行列でいえば、$\rho_s, \rho_c$は(-1.392, 1)の範囲を動ける。
 $\rho_s, \rho_c$を動かしながら、隣接州(107ペア)の相関がどうなるかをチャートにしてみると、面白いことがわかる。
 $\rho_s, \rho_c$が0のとき、隣接州の相関は0になる。増やしていくと相関も単調に上がっていき、1まで増やせばみんな相関1になる。なお、CARモデルで$\rho_c$を増やした時よりも、SARモデルで$\rho_s$を増やしたときのほうが、隣接州の相関は速く上がる。ここまでは、まあ、いいですよね。
 問題はここからだ。隣接州107ペアの相関の高さの順序は一定でない。$\rho_s$なり$\rho_c$なりを増やしていくと、順序がどんどん入れ替わっていくのだ。
 さらに。$\rho_s, \rho_c$を負の方向に動かした時は奇妙なことが起こる。最初はどのペアの相関も負になっていくが、途中から突然正の相関を持つペアが生じるのである。結局、107ペアのうち37ペアは正になる。どういうペアが正になるかを簡単に説明する方法はない。
 
 このように、SARモデル・CARモデルによる空間相関は直観に反する。なお、これは$\mathbf{W}$の行規準化をやめても変わらない。

 かつてCressie(1993)は、$\mathbf{B}, \mathbf{C}$を「空間従属行列」と呼んだ。この行列の要素$(i,j)$は、地点$i, j$の相互作用の程度を表現していると考えられてきた。そういう言い方は実はミスリーディングである。空間構造を本当に説明しているのは$(\mathbf{I} - \mathbf{B})^{-1}$, $(\mathbf{I} - \mathbf{C})^{-1}$である。$\mathbf{B}, \mathbf{C}$と空間相関のあいだに直観的な関係はない。空間構造に関心があるなら、地球統計学のモデルのように、共分散構造を直接モデル化する手を考えたほうが良い。

 SARモデル・CARモデルは広く使われているが、その意味についてきちんと考えている人は少ない。これはおそらく、分析者の関心が空間構造そのものというより回帰の予測子に向けられているからだろう。しかし!もしあなたが、モデルがデータに合致しているかどうかを決めようという立場なら、まずはモデルの意味を知ろうとしたほうがいいんじゃないですか?
 云々。

 。。。いやー、これは面白かった。
 このたび小地域推定の関連で勉強していて、SARモデルやCARモデルって直観的にはどういうことなのだろうかと不思議に思っていたのである。だって、どちらもローカルな空間的従属性についてモデル化しているのに、結局は大域的な相関構造が生まれるじゃないですか。隣接行列をいくら思い返しても、相関行列が想像できない。そうか、あれは直観的にわかる話ではないのね。謎が氷解したという感じだ。
 空間自己相関パラメータが負になった時にとんでもないことが起きるというのも面白かった。たしかにね、地域の形が不規則だったら、なにが起きても不思議でない。
 というわけで、きちんと積み上げて勉強している人にとっては当たり前の話をしているのかもしれないけど、私のように付け焼刃だけで凌いでいる者にとっては、とても啓蒙的な論文であった。思わずwebで写真を探してしまった(町内会の会合にクッキー持ってきそうな、気の良さそうな女性であった)。メラニー先生、どうもありがとー。

論文:データ解析(2018-) - 読了: Wall (2004) SARモデル・CARモデルは実は君が思っているような空間モデルではないかもしれないよ?

2018年7月10日 (火)

 これは徹頭徹尾自分向けのメモでございます。
 仕事の都合で空間計量経済学の資料をあたっていると、XXXモデルという英字三文字の略語が乱舞し、しかもその意味が人によってかなりちがっていたりする。
 許すまじ学者ども、とっつかまえて海の藻屑にしてやろうか、と腹を立てていたのだが、怒っていてもらちがあかないので、メモをとってみた。とりあえず、いま手元にある3冊のデータ解析者向け解説書の記述を比較しておく。

瀬谷・堤(2014)「空間統計学
 6.1, 6.2.1, 6.2.2よりメモ。

 いわく。格子データのモデリングは大きく次の2つに分類できる。

  • マルコフ確率場・条件分布に基づく方法。Besag(1974)が代表的。conditional autoregressive model(CAR)を使うことが多い。階層ベイズモデルの枠組みで便利。しかし、空間重み行列が対称であることが求められるので、空間計量経済学ではあまり用いられない。
  • 非マルコフ確率場・同時分布に基づく方法。Anselin(1988)が代表的。smimultaneous autoregressive model (SAR)を用いることが多い。

 というわけで、以下では後者について解説する。

 空間計量経済学においては、空間自己相関をモデル化する際、次の2つのモデルがよく用いられる。

1. 空間ラグモデル(spatial lag model, SLM)。mixed regressive spatial autoregressive model, spatial autoregressive model(SAR)と呼ばれることもある。

 SLMでは従属変数間に自己相関を導入する。空間的・社会的な相互作用の結果として生じた「均衡」のモデル化だといえる。一般的な形式としては
 $y_i = g(y_{j \in S_i}) + \beta_0 + \sum_h x_{hi} \beta_h + e_i$
ふつうは空間重み行列を使って単純化する。
 $y_i = \rho \sum_j^n w_{ij} y_j + \beta_0 + \sum x_{hi} \beta_h+ e_i$
右辺に$y$の空間ラグがあるという意味では時系列でいう自己回帰と似ている。
 行列で書くと
 $\mathbf{y} = \rho \mathbf{W} \mathbf{y} + \mathbf{X} \mathbf{\beta} + \mathbf{e}$

2. 空間誤差モデル(spatial error model, SEM)。これがsimultaneous autoregressive model(SAR)と呼ばれていることもある。

 SEMでは誤差項間に自己相関を導入する。経済理論的な理由というより、空間的に系統性のある観測誤差といったデータの問題を処理するために用いられることが多い。
 誤差項のモデル化の方法にはたくさんある。4つ紹介するが、いちばん良く用いられているのは2-1.SAR誤差である。

2-1. SAR誤差(spatial autoregressive)。これを狭義のSEMと呼ぶこともある。
 $\mathbf{y} = \mathbf{X} \mathbf{\beta} + \mathbf{u}, \ \ \mathbf{u} = \lambda \mathbf{W} \mathbf{u} + \mathbf{e}$
$\mathbf{u}$の共分散行列は
 $E[\mathbf{uu}'] = \sigma_e^2(\mathbf{I}-\lambda \mathbf{W})^{-1} (\mathbf{I}-\lambda \mathbf{W'})^{-1}$
となる。ここで$(\mathbf{I}-\lambda \mathbf{W})^{-1}$を空間乗数という。$\mathbf{I}-\lambda \mathbf{W}$が正則であることが求められる。
 SAR誤差モデルの場合、ある地点のショックが他のすべての地点に波及する。また、地点の近傍集合の個数が地点によって違うとき、たとえ$e$がiidであっても$\mathbf{u}$の分散は不均一になる。

2-2. SMA誤差(spatial moving average)。
 $\mathbf{u} = \gamma \mathbf{W} \mathbf{e} + \mathbf{e}$
$\mathbf{u}$の共分散行列は
 $E[\mathbf{uu}'] = \sigma_e^2(\mathbf{I}+\gamma \mathbf{W})(\mathbf{I}+\gamma \mathbf{W})'$
 ある地点におけるショックは、$\mathbf{W}$を通した1次の影響と, $\mathbf{WW}'$を通した2次の影響しかもたない。なお、SAR誤差と同じく、地点の近傍集合の個数が地点によってちがうと共分散は定常でなくなる。

2-3. SEC誤差(spatial error component)。
 $\mathbf{u} = \mathbf{W} \mathbf{\phi} + \mathbf{e}$
誤差をスピルオーバーする部分$\mathbf{\phi}$としない部分$\mathbf{e}$に分けている。$\mathbf{\phi}$と$\mathbf{e}$の各要素はiidで、2本のベクトル間に相関はないと考える。
$\mathbf{u}$の共分散行列は
 $E[\mathbf{uu}'] = \sigma_\phi^2 \mathbf{WW}' + \sigma_e^2 \mathbf{I}$
 SEC誤差はもともとSAR誤差の代替案として提案されたものであった。$(\mathbf{I}-\lambda \mathbf{W})$は正則でなくてもよい。しかし共分散行列をみると、局所的相関しか考慮していないわけで、むしろSMA誤差に近い。

2-4. CAR誤差(conditonal autoregressive)。
 これはSAR誤差との対比で紹介されることが多い。SAR誤差では$\mathbf{u}$の同時分布をモデル化したが、ここでは近隣集合の下での条件付き分布をモデル化する。
 $E(u_i | u_j, j \neq i) = \eta \sum_j w_{ij} u_j$
$\mathbf{W}$にいくつか制約をつけると、
 $E[\mathbf{uu}'] = \sigma^2 (\mathbf{I} - \eta \mathbf{W})^{-1}$
となる。
 [話がすごくややこしいが、2.の空間誤差モデルの一部ではあるものの、2-1,2-2,2-3のような同時自己回帰モデルではないわけだ]

3. SLM(空間ラグモデル)とSEM(空間誤差モデル)の複合型もある。

3-1. 一般化空間モデル(SACモデル)
 [別の資料によれば、SACとはgeneral spatial autoregressive model with a correlated error termの略である由。] SARARモデルともいう(spatial autoregressive model with spatial autoregressive disturbances)。
 $\mathbf{y} = \rho \mathbf{W} \mathbf{y} + \mathbf{X} \mathbf{\beta} + \mathbf{u}, \ \ \mathbf{u} = \lambda \mathbf{W} \mathbf{u} + \mathbf{e}$
 空間ラグモデルと空間誤差モデル(SAR誤差)をあわせたものになっている。

3-2. 空間ダービンモデル(spatial Durbin model, SDM)。
 $x$は定数項抜きとして、
 $\mathbf{y} = \rho \mathbf{W} \mathbf{y} + \mathbf{X} \mathbf{\beta} + \mathbf{W x \delta} + \mathbf{e}$
 SACモデルから$\mathbf{W u}$を落として、かわりに従属変数と説明変数の空間ラグをいれているわけだ。実はこのモデル、SAR誤差モデルから導くことができる。

古谷(2011)「Rによる空間データの統計分析

上記のメモとの対応は以下の通り。

  • 10.4.1 同時自己回帰(SAR)モデル... 誤差の自己相関パラメータが空間重みづけ行列で決まるのであれば、同書10.5.2と同一。すなわち 2-1. SAR誤差モデル。
  • 10.4.2 条件付き自己回帰(CAR)モデル... 2-4. CAR誤差モデル。
  • 10.5.1 空間的自己回帰モデル(空間同時自己回帰モデル, spatial auto-regression model) ... 1. 空間ラグモデル。
  • 10.5.2 誤差項の空間的自己回帰モデル(空間誤差モデル, SEM, spatial error model) ... 2-1. SAR誤差モデル。
  • 10.5.3 空間ダービンモデル ... 3-2.空間ダービンモデル。

谷村(2010)「地理空間データ分析

上記のメモとの対応は以下の通り。

  • 5.1.2 空間ARモデル ... 1.空間ラグモデルの、共変量がないやつ。
  • 5.1.3 空間同時自己回帰モデル ... 1.空間ラグモデル。
  • 5.1.4 空間誤差モデル(spatial error model, SEM) ... 2-1.SAR誤差モデル。
  • 5.1.5 空間Durbinモデル(spatial Durbin model, SDM) ... 3-2.空間ダービンモデル。
  • 5.1.6 条件付き自己回帰モデル(conditional autoregressive model, CAR model) ... 2-4.CAR誤差モデル。

雑記:データ解析 - 覚え書き: 空間計量経済学における忌まわしき英字三文字略語たち

2018年7月 3日 (火)

Bookcover Small Area Estimation (Wiley Series in Survey Methodology) [a]
J. N. K. Rao,Isabel Molina / Wiley / 2015-08-24
ここ2週間ほど、常にこの本を携帯し、少しの時間でもあれば頁を開き、寝ても覚めても小地域推定のことばかり考えていた。仕事の都合での勉強ではあったのだが、いいかげん他の仕事も詰まってきたし、考えれば考えるほど難しくて吐きそうになり、いまや日常生活にも支障が生じ始めた。いったんここでやめて、少し頭を冷やすことにする。
 読書ノートはこちら。読み返すと、学力不足で理解に達していない箇所が多い。哀しいことだが、逆にいうと、基本的な数学もわからないのに、よくもまあ読もうという気になったものだ、ちょっとしたドン・キホーテだ。

データ解析 - 読了:"Small Area Estimation"

2018年6月20日 (水)

 仕事の都合で小地域推定 (SAE) の勉強をしているんだけど、Rのパッケージが多すぎて困っている。別に使い分けたいわけじゃないんだけど、「もっといいパッケージがあるのでは...」という疑念が頭からは離れないのである。精神衛生に悪い。
 現時点でのパッケージを調べてみたので、メモしておく。

 CRAN Task ViewsにOfficial Statisticsというのがあり、そこのSAEの項目には、SAEに特化したパッケージとして次の3つが挙げられている。

  • rsaeパッケージ。Task Viewsによれば、「基本的なユニット・レベルSAEモデル(nested error回帰モデル)のパラメータをMLないしロバストMLにより推定。MSE推定値、パラメトリック・ブートストラップなどによる、地域ごとの平均のロバストな予測を提供する。カテゴリカル独立変数は扱えない」とのこと。最終更新は2014/02。
  • hbsaeパッケージ。「基本地域ないしユニット・レベルモデルに基づくSAEを計算。制約付きML法、階層ベイズ法を用いる。補足情報として、カテゴリカル変数から得られるカウント、ならびに連続的人口情報から得られる平均を使うことができる」。最終更新は2012/09。
  • JoSAEパッケージ。「GREGによる点推定・分散推定、ユニットレベルのEBLUP推定量をドメインレベルで提供」とかなんとか(云ってる意味がよくわからん)。これは基本的には後述するnlmeパッケージのラッパーである由。最終更新は2018/05。

Task Viewsに載っていないパッケージとして、見つけたのは以下。といっても、googleで検索しただけだけど。

  • saeパッケージ。SAEについての教科書 Rao & Molina (2015) で紹介されているのがこれである。開発者による解説もある(いま気が付いたけど、開発者のひとりがMolinaさんなのだ)。最終更新2018/06(おお、先週だ...)。
  • saeRobustパッケージ。説明によれば、「通常使われているSAEモデルのロバストな代替手法を提供。BLUP予測と線形混合モデルに基づく。ランダム効果に時空間的相関があるエリアレベルモデルが利用可能」とのこと。最終更新2018/03。
  • maSAEパッケージ。「MandallazのモデルによるSAE」という謎のパッケージである。Mandallazという人の論文を読まんといかんらしい。最終更新2016/08。
  • BayesSAEパッケージ。ベイズなんでしょうね。最終更新2018/04。
  • saeryパッケージ。時間効果のはいった地域レベルのEBLUP。最終更新2014/09。
  • sae2パッケージ。時系列地域レベルモデル。最終更新2015/01。
  • emdiパッケージというのもある。「地域非累積指標の推定・評価・マッピング」とのことで、よくわかんないんだけどこれもSAEのパッケージなのではなかろうか。最終更新2018/04。
  • saeSimパッケージ。saeRobustと同じ人が開発している。これは推定のパッケージというよりシミュレーションの面倒をみるパッケージらしい。Task ViewsにもMicrosimulationのパッケージとして載っている。
  • ほかにmmeパッケージというのがあったんだけど、先月CRANから消えた模様。

 なお、SAEに特化したパッケージではなく、一般的な混合モデル・階層モデルのパッケージを使うという手もあろう。Task ViewsにはSAEの項目の下に、nlmeパッケージとlme4パッケージがあがっているが、別に他のパッケージでもいいのではなかろうか。久保先生のページでは、正規分布の混合モデルのパッケージとしてnlme, lme4が挙げられているほか、一般化混合モデルのパッケージとしてglmmML, MCMCglmmがお勧めされている。

雑記:データ解析 - 覚え書き:小地域推定のためのRパッケージ

2018年6月17日 (日)

Ozimec, A.M., Natter, M., Reutterer, T. (2010) Geographical Information Systems-Based Marketing Decisions: Effects of Alternative Visualizations on Decision Quality. Journal of Marketing, 74, 94-110.

 差し迫った原稿の準備のために集めた論文のひとつ。アブストラクトを眺めた段階で「これはちがう... いま探してる奴じゃねえ...」と気が付いたのだが、しかしあまりに面白そうで、ついつい最後まで読んでしまった。なにやってんだか。こういうことだからダメなんだろうな。

 マーケティング分野でのトップ誌 Journal of Marketing に載ってはいるが、これ、Applied Cog.Sci.とかに載ってても全然おかしくない。要するに、地図上での情報視覚化についての実験研究なのだ。

 先行研究。
 意思決定支援において視覚情報は大事だ。その効果は視覚表現によってもちがう。
 先行研究には大きく3つある。

  • 表 vs. 図の比較。決定課題と問題表現の認知的適合性が高いと良い、とか。
  • 同一のシンボルタイプ内での比較。パイチャートよりバーチャートが良い、とか。
  • 異なるシンボルタイプ間での比較。Cleveland & McGill(1984 JASA)の基本知覚課題の理論とか[「共通尺度上の位置で表現するのがいちばん良い」ってやつ]。

 本研究は3番目に属する。マーケティングでGISを使うという文脈に注目する。Clevelandらの研究をそのままあてはめることはできない。なぜなら、

  • GIS上の主題図はたいていシンボルがたくさん載っているので、すでに過負荷の状態にある。このことを考慮しないといけない。
  • Clevelandらの課題は比較的シンプルだったが、マーケ意思決定はふつう多次元的。

 概念枠組み。
 GIS上で主題図を見て、いろんな基準に基づき、それぞれの位置における収益レベルを評価する、という場面について考える。
 マーケにおいて用いられるGIS上の主題図のうち、以下の4種類に注目する。

  • コロプレス地図[塗り分け地図のことね。県の人口を県の色の濃さで表す]
  • あんまし使われてないけど、カルトグラム[人口の多い県はでかく描く]
  • 比例シンボル[県の人口を県の位置に置いた円の大きさで表す]。円が重ならないように小さく描くのと(squeezing)、重なってもいいから大きめに描くのと(overlap)、2種類。
  • ダイアグラム地図[県の人口を県の位置に置いた柱の高さで表現する]。小さめに描くのと(squeezing)、大きめに描くのと(overlap)、大きめに描いて重ならないようずらすのと(dislocation)、3種類。

ここでsqueezing/overlap/dislocationのちがいは、過負荷のハンドリングのちがいと捉えられる。
 これらが意思決定のパフォーマンスの測度に与える効果を調べる。測度として、決定の正確性(決定者が選んだ位置の収益が最適位置の何パーセントだったか)、決定の効率性(所要時間)、決定者の確信度、課題の容易性の知覚、を用いる。
 さらに、効果のモデレータとして、課題の複雑性(決定基準の数、選択肢の類似性)、ユーザ属性(空間能力、地図の経験)、時間圧力に注目する。
 
 仮説。

  1. 色の濃さより、円や柱を使った方が、決定課題の成績が良くなる。なぜなら、Bertin(1983)のサインシステム論によれば...[とひとしきり理屈が書いてあるが、要するに色の濃さを比べる際には「こっちのほうが何倍大きい」という読み方ができないから、という話]
  2. 色の濃さと歪みを併用すると[カルトグラムのこと]、単一のシンボル化を複数種類使うよりも成績が良くなる。なぜなら、Wolfe(1994)のGuided search理論によれば、単一のシンボル化の場合はひとつづつ系列的に処理するようになるから。
  3. 柱を使うよりも円を使った方が成績が良くなる。Clevelandらとは逆の仮説だけど、地図研究では先行研究がある。柱は狭くて視覚的に不安定だから[←この説明もよくわからん]
  4. 円の重複よりも柱の重複のほうが悪影響をもたらす。なぜなら...[面倒くさいので省略するけど、理屈が縷々述べてある。ゲシュタルト心理学まで引き合いに出して]
  5. 柱をずらすと重複しているときより成績が悪くなる。場所との関係をつかみにくくなるから。
  6. 決定課題において選択肢間の類似性が高くなると、色の濃さだけを使うのと比べて、色の濃さと歪みを併用するほうが成績が良くなる。なぜなら、色の濃さだけ使っている場合、面積は(実際には意味がないのに)その地域の重要性として受け取られてしまい、決定課題が複雑なときには特にそのバイアスが効いてくるから。[面白い理屈だ]

 お待たせしました、実験です。
 オンライン実験。被験者数1349、うち3割強が仕事でGISを使っている[←どうやってリクルートしたんだ...]。
 課題は、GIS主題図をみせて、「家具小売の新規出店候補地5つのなかから、もっとも魅力的な場所をひとつ選べ」。GIS主題図には決定の基準となる変数が全部載っているんだけど、コロプレス図と比例シンボルは地図一枚あたり1変数しか表せないし、カルトグラムは2変数、ダイアグラム図は3変数までにしたので、たとえば決定基準の数が6ならば、コロプレス図と比例シンボルは6枚、カルトグラムは3枚、ダイアグラム図は2枚を並べてみせることになる。
 要因は次の4つ:

  • GIS主題図。上述の7水準、被験者間。
  • 時間圧力。{時間制限なし, あり}、被験者間。
  • 選択肢の類似性。一位選択肢と二位選択肢の間の類似性が{高い,低い},  被験者間。[詳細略]
  • 決定基準の数{平均購買力と人口の2つ, それに加えて駐車スペースの有無など計6つ}, 被験者内。

 要するに、被験者間が7x2=14水準、被験者内が2x2=4水準である。

 結果。どの仮説もだいたい支持。

 考察。
 シンボルのタイプは、円、色の濃さ+歪み、色の濃さ、柱の順に優れている。柱は重複に弱いし、重複を避けるためにずらすのもやはり良くない。マーケターのみなさん、円をもっと使うといいよ。
 云々、云々。
 
 ... いやー、楽しいなあ。
 正直なところ、仮説を導入する際の理屈の長さに閉口したが(仮説自体はそりゃそうだろうよというようなものなので特に)、論文たるものかくあるべきだよな、という気もする。全く同じ実験データを得ていても、仮説を先に述べずに結果を後づけで解釈してたら、きっと大変にしょぼい感じの論文になっていただろう。もちろん、実際には結果を先にみてから仮説を考えてるんだろうけど、これがお作法の美しさというものだ。

 というわけで、マーケティング研究の皮を被った人間工学的実験研究を堪能した次第だが、課題状況を実務場面に近づけましたと主張するタイプの実験研究が往々にしてそうであるように、この課題状況が本当に実務場面に近いのか、実は誰にもわからんのではないかという気がする。
 早い話、BIツールの担当者が「なるほど、出店候補地を比較する上で検討したい変数が6つあるんですね、わかりました、じゃ地図を6枚並べて表示しますんで眺めて下さい」なんてことをいってると、出店計画の担当者は「てめぇふざけんな」と怒り出すのではないか。ふつうは、6変数をなんらか組み合わせて収益性を予測し一枚の地図上に表現するか、地図でみせるのを諦めるんじゃないかと思うのだが、そんなことないですか?
 このへんが「実務場面に近い」という言い方の怖いところで、「実務」というのはあいまいで幅が広く、それがなんなのか、実は誰も知らないのである。

論文:心理 - 読了:Ozimec, Natter, Reutterer (2010) マーケティング実務家のみなさんのために、地図上でなにかの変数を表現する際の良い描き方について調べました

2018年6月13日 (水)

高阪宏之(1993) 市場分析に対する地理情報システムの可能性. GIS-理論と応用, 1, 23-33.

 著者は地理学の先生らしい。電算機による空間的意思決定支援システムはマーケティングに役に立つであろうという概説。掲載されたのはこの雑誌の創刊号だから、きっといろんな専門家がいろんな分野について述べたのであろう。
 いやあ... ある分野が新しく立ち上がるときってのは、きっと楽しいでしょうね...

論文:マーケティング - 読了:高阪(1993) 電算機による空間的意思決定支援システムを市場分析に活用すべき時代がやってきた in 1993

2018年6月12日 (火)

行川一郎(2015) 地方/地域活性化とマーケティング : 地方創生のためのマーケティング・ツール. 国際経営フォーラム, 26, 1-19.

 掲載誌は神奈川大の紀要、著者はそこの先生らしい。企業のエリア・マーケティング手法を使って地域を活性化できるんじゃないだろうかというような大きな内容であった。

論文:マーケティング - 読了:行川(2015) エリア・マーケティングのツールはきっと地域活性化に役立つだろう

松岡公二(2005) 消費者購買行動把握におけるGeographic Information Systemを利用したエリアマーケティングの役割. 拓殖大学経営経理研究 74, 147-176.

 えーと、小売店の立地を最適化する方法としてマーケットシェア関数というのがあって、人口データと年齢階級別消費支出データを使って平面上で予測売上高を求めた、という話であった。

論文:マーケティング - 読了:松岡(2005) 居住者データとかを使って店舗の立地を評価する

土橋明(2009) 既存のエリア・マーケティングに対する問題点の一検討 : 社会指標値(PLI)と実態調査の比較分析. 北海学園大学経営論集 7, 87-98.

 著者は経営学の博士の学生さんらしい。最初は問題設定がつかめなくて困惑したんだけど(私のせいです)、次のような研究。
 ここでいう社会指標というのは、朝日新聞社の「民力」みたいなやつ(ありましたね、そういえば)。こういうのが行政・民間にわたっていっぱいある。旧経済企画庁は「新国民生活指標」(PLI)というのを公表していた。「住む」の豊かさは北陸が高く、「働く」の豊かさは中国が高いんだそうです。で、連続最下位になった埼玉県が激怒し、99年を最後に中止された。
 そこで、5都市について別に住民満足度のアンケートをかけて(著者はこれを「質的データ」と呼んでいるのである。たぶん住基台帳とかを使ってないという意味であろう)、PLIと比較してみた。という話であった。えーと、いろいろ違っていた由。
 なぜこれが「既存のエリア・マーケティングの問題点」かというと、PLIは「エリア・マーケティングを行う際には貴重な定量的データとなることは周知のとおり」だから、という主旨である模様。そうなんですか。

論文:マーケティング - 読了:土橋(2009) 5都市で住民の生活満足度をアンケート調査し、経済企画庁「新国民生活指標」と比較した

竹村和久(1992) ファジィ多属性態度モデルによる購買目的地選択の分析について:エリア・マーケティングのための消費者心理測定の提案. , 地域学研究, 22, 119-132.

 かの竹村先生の若き日の論文。多属性態度モデルを拡張し、属性に対する信念とその評価の両方をファジイ数にする、という内容であった。適用例は購買目的地選択。ちょうどブランド選択を説明する際に多属性態度モデルを使うように、「××を買うときにどこで買うか」選択をこの拡張モデルで説明する。
 タイトルに「エリア・マーケティング」とあるのに反応して手に取ったという事情があり、肝心のモデルのほうは適当に読み飛ばしてしまった。すいません。

論文:マーケティング - 読了:竹村(1992) 多属性態度モデルをファジイ集合に拡張する

<< 読了:池谷・長坂(1993) スーパーを地図にプロットしてみた
 
validate this page / CSS