2015年8月17日 (月)
Camerer, C.F., Fehr, E. (2009) When does "Economic man" dominate social behavior? Science, 311(5757), 47-52.
いま仕事で予測市場のことを考えてて、いろいろ思い悩むこと多く、魅力的なタイトルに惹かれてふらふらと読んでしまった。実験論文かと思いきやレビューであった(REVIEWと大書している字が大きすぎてかえって気づかなかった)。よく知らないけど、第一著者は行動ゲーム理論の教科書を書いている人だと思う。
ええと。。。
個人は合理的意思決定者です、純粋に自己配慮的(self-regarding)な選好を持ってます。これが多くの経済的分析の基礎にある想定だ。
- 合理性の想定は二つの部分を含んでいる:(1)個人は環境における出来事や他者の行動についての信念を形成し、それは平均的に見て正しい。(2)個人は自らの信念のもとで自らの選好をもっともよく満たす行為を選択する。
- 選好の自己配慮性とは、自分の経済的厚生に影響しない限り、結果そのものや他者の行動に関心を持たないことをいう。選好が道徳と無関係だという想定だともいえる。
多くの人々が、この合理性の想定と自己配慮的選好の想定に反した姿を示す。このことは経済学において繰り返し示されている。
しかし、市場や政治過程といった集団レベルの実体が示す行動においても、これらの違反が姿を現すかどうかは別の問題である。参加者の一部がこれらの想定に違犯しているのに、集計レベルでの結果は全員が合理的・自己配慮的であるという想定と合致する、という実験例は数多い。
問題は、集団レベルの結果が、異質な参加者の間の相互作用によってどのように形成されているか、である。
- 囚人のジレンマゲームについてみてみよう。近年の研究は、強いreciprocators[互いの利益を考慮する人のことであろう]が一定割合存在することを示している。[... 実験の紹介... ] とこのように、強いrecirocatorsの存在によって、「経済学的人間」の行動が変わることもあれば、限定合理的だったり他者配慮的選好を持っていている人が「経済学的人間」としてふるまうようになることもある。
- バーゲニングでもそうだ。最後通牒ゲームについてみてみよう。売り手側に競争があると急に言い値が下がるのだが、[... 実験の紹介...] とこのように、自己配慮的エージェントの存在がreciprocatorsをして自己配慮的エージェントのように行動せしめるのである。この現象をうまく説明するモデルも登場している。たとえば不平等性回避の理論。
集団レベルでの行動について理解するための鍵は「戦略的代替性」と「戦略的補完性」だ。[... 説明 ...]
- 次のゲームについて考えよう。多くのプレイヤーが0から100のあいだの数字を同時に選ぶ。その平均の2/3倍に最も近かった人に固定額の商品を渡す。ケインズにちなんで「美人投票ゲーム」と呼ばれるゲームである。ゲーム理論の観点からいえば、全員が0と答えるのがナッシュ均衡であるが、実際にはそうならない。
- 今度は次のビジネス参入ゲームについて考えよう。12の企業がある。ある市場に参入したらペイオフ0.5。別の競争市場もあって、あるサイズ c を超えるまではペイオフ1, 超えたらペイオフ0。このゲームではナッシュ均衡は「c社が競争市場に参入する」である。実際、コミュニケーションなしの一発実験でも均衡に近い結果になる。
このちがいはなぜ生じるのか。ポイントは、美人投票ゲームの数字は戦略的補完物で(非合理的な人と同じことをすることにインセンティブがある)、ビジネス参入ゲームの選択は戦略的代替物だ(非合理的な人と違うことをすることにインセンティブがある)という点だ。
統一的な説明原理があるかって? あります。そのひとつが「認知的階層性」の理論。戦略的推論においてまわすステップ数の分布を考えて... [説明略]
戦略的代替性と補完性は市場においても重要だ。たとえば、予測市場による予測が正確なのは、貧しい情報しか持たないトレーダーのおかげで、豊かな情報を持つトレーダーが儲けることができるからだ(戦略的代替性)。これに対し実際の証券市場では、取引成績のプレッシャーや空売りの困難さなどのせいで、情報を持っていないトレーダーが、情報を持っていない群衆に従わざるを得ないことが起きる(戦略的補完性)。
云々。
。。。あんましきちんと読んでないけど、面白かったっす。意外な文脈で予測市場の話が出てきたりして、身も蓋もないご意見にウウウウと呻いたりなんかして。先生に言わせれば、予測市場の勝因は正解があとでわかる点にある、その点で実際の証券市場より良くできている、ということになろう。
このレビュー論文のテーマとはちょっとずれるけど、集団の合理性と個人の合理性ってちょっとちがう、でもそのことをついつい忘れちゃうよなあ... と考え込んだ。
予測市場の話でもそうで、ついつい、予測市場をうまく機能させるために、いかにして市場参加者をして利益最大化を追求せしめるか、というふうに考えてしまうのだけれど、本質的にはそうではないのでしょうね。要するに取引メカニズムを通じて情報が集約されたり生成されたりすればそれでよいのであって、そのことと、個々人が自らの選好に基づき利益最大化を図るかどうかとは、おそらくちょっとフェイズの違う問題なのだ。
論文:予測市場 - 読了:Camerer & Fehr (2009) 集団が合理的経済人として振る舞うのはどんなとき?
2015年8月16日 (日)
SF的な宇宙で安全に暮らすっていうこと (新☆ハヤカワ・SF・シリーズ)
[a]
チャールズ・ユウ / 早川書房 / 2014-06-06
小説はふだん自粛しているんだけど、つい出来心で読んじゃった奴。タイムマシンを題材にしたSF家族小説でありました。
フィクション - 読了:「SF的な宇宙で安全に暮らすっていうこと」
最後の「日本人」―朝河貫一の生涯 (岩波現代文庫)
[a]
阿部 善雄 / 岩波書店 / 2004-07-16
日米開戦回避のために尽力した在米の歴史学者・朝河貫一の伝記。83年刊の単行本を近所の古本屋で見つけ、関心を惹かれて買った。いま調べたら、岩波現代文庫にはいってんじゃん。なあんだ。
日本近現代史 - 読了:「最後の『日本人』 朝河貫一の生涯」
豆腐と生きる 今、伝えたいリーダーの言葉 豆腐メーカー経営者インタビュー集
[a]
フードジャーナル編集部 / ㈱フードジャーナル社 / 2014-09-24
「豆腐と生きる」だって...?! と、あまりに魅力的なタイトルに胸を撃ち抜かれ、どうしても読んでみたくなり、版元に直接注文した。
「フードジャーナル」は大豆加工食品の業界誌。この本は雑誌に掲載された豆腐メーカー経営者のインタビュー記事をまとめたもの。オールカラー102頁、おそらく掲載社にどさっと買い上げてもらうのが目的であろうブックレットなのだけど、素人が読んでもなかなか面白かったです。
幻滅 〔外国人社会学者が見た戦後日本70年〕
[a]
ロナルド・ドーア / 藤原書店 / 2014-11-22
ハンナ・アーレント、あるいは政治的思考の場所
[a]
矢野 久美子 / みすず書房 / 2002-02-20
切り捨てSONY リストラ部屋は何を奪ったか
[a]
清武 英利 / 講談社 / 2015-04-10
ノンフィクション(2011-) - 読了:「豆腐と生きる」「幻滅 外国人社会学者が見た戦後日本70年」「ハンナ・アーレント、あるいは政治的思考の場所」「切り捨てSONY」
ぼくはスピーチをするために来たのではありません
[a]
ガブリエル ガルシア=マルケス / 新潮社 / 2014-04-30
久々に「百年の孤独」を読み返したくなった。本がどこかにあるはずなのだが...
本屋になりたい: この島の本を売る (ちくまプリマー新書)
[a]
宇田 智子 / 筑摩書房 / 2015-06-08
独裁者は30日で生まれた ヒトラー政権誕生の真相
[a]
H・A・ターナー・ジュニア / 白水社 / 2015-05-22
もじれる社会: 戦後日本型循環モデルを超えて (ちくま新書)
[a]
本田 由紀 / 筑摩書房 / 2014-10-06
増補 魔女と聖女: 中近世ヨーロッパの光と影 (ちくま学芸文庫)
[a]
池上 俊一 / 筑摩書房 / 2015-06-10
悲しみを抱きしめて 御巣鷹・日航機墜落事故の30年 (講談社+α新書)
[a]
西村 匡史 / 講談社 / 2015-07-23
ノンフィクション(2011-) - 読了:「本屋になりたい」「独裁者は30日で生まれた」「ぼくはスピーチをするために来たのではありません」「もじれる社会」「魔女と聖女 中近世ヨーロッパの光と影」「悲しみを抱きしめて」
忘れられない (マーガレットコミックス)
[a]
谷川 史子 / 集英社 / 2012-05-25
ブルー・サムシング (マーガレットコミックス)
[a]
谷川 史子 / 集英社 / 2015-07-24
この名人的マンガ家の、画面構成の美しさ、巧みさといったら、もう... うまく言葉にできないのがもどかしい。
東京タラレバ娘(1) (KC KISS)
[a]
東村 アキコ / 講談社 / 2014-09-12
東京タラレバ娘(2) (KC KISS)
[a]
東村 アキコ / 講談社 / 2015-05-13
東京タラレバ娘(3) (KC KISS)
[a]
東村 アキコ / 講談社 / 2015-08-12
いま話題のマンガ。いやいや、ひたすらベンチで女子会を繰り返して歳を取っていくのも素敵じゃないですか? ひとの人生なんて所詮不毛なものよ... なあんて私は思っちゃいますけどね。ま、好き嫌い別にして、読むと心がざわざわするというか、なにか一言云いたくなる作品である。
コミックス(2015-) - 読了:「東京タラレバ娘」「忘れられない」「ブルー・サムシング」
こうしてみると、マンガばっかり読んでるなあ...
こいいじ(2) (KC KISS)
[a]
志村 貴子 / 講談社 / 2015-08-12
銀の匙 Silver Spoon 13 (少年サンデーコミックス)
[a]
荒川 弘 / 小学館 / 2015-06-18
ラブやん(22)<完> (アフタヌーンKC)
[a]
田丸 浩史 / 講談社 / 2015-07-23
茄子とアルタイル 1 (ビッグコミックス)
[a]
大野 ツトム / 小学館 / 2015-06-30
バーナード嬢曰く。 2 (IDコミックス REXコミックス)
[a]
施川ユウキ / 一迅社 / 2015-07-27
ダンジョン飯 2巻 (ビームコミックス)
[a]
九井 諒子 / KADOKAWA/エンターブレイン / 2015-08-12
昭和元禄落語心中(8) (KCx)
[a]
雲田 はるこ / 講談社 / 2015-08-07
コミックス(2015-) - 読了:「こいいじ」「銀の匙」「ラブやん」「茄子とアルタイル」「バーナード嬢曰く」「ダンジョン飯」「昭和元禄落語心中」
新装版 親なるもの 断崖 第1部 (ミッシィコミックス)
[a]
曽根富美子 / 宙出版 / 2015-07-10
新装版 親なるもの 断崖 第2部 (ミッシィコミックス)
[a]
曽根富美子 / 宙出版 / 2015-07-10
社会派作品で知られる曽根富美子さんの旧作。傑作という評判だけ聞き及んでいたのだが、長いこと絶版で読めなかった。ところがある電子書籍サービスがこの作品を大プッシュ、評判が評判を呼び再刊に至った由。偉いぞ「まんが王国」!
室蘭の遊郭に売られた女たちの二代にわたる人生を、昭和史とともに辿る。噂どおり、これは大変な傑作であった。
百鬼夜行抄 24 (Nemuki+コミックス)
[a]
今 市子 / 朝日新聞出版 / 2015-07-07
ワカコ酒 5 (ゼノンコミックス)
[a]
新久千映 / 徳間書店 / 2015-07-18
いぬやしき(4) (イブニングKC)
[a]
奥 浩哉 / 講談社 / 2015-07-23
少女終末旅行 2 (BUNCH COMICS)
[a]
つくみず / 新潮社 / 2015-07-09
BLUE GIANT 6 (ビッグコミックススペシャル)
[a]
石塚 真一 / 小学館 / 2015-07-30
海月と私(4)<完> (アフタヌーンKC)
[a]
麻生 みこと / 講談社 / 2015-08-07
最終巻。正体不明の魅力的な女に振り回される男という、オッサンのファンタジーを臆面もなく描く作品であった。面白かった。
コミックス(2015-) - 読了:「親なるもの 断崖」「ワカコ酒」「百鬼夜行抄」「海月と私」「いぬやしき」「少女終末旅行」「BLUE GIANT」
鼻紙写楽 (ビッグコミックススペシャル)
[a]
一ノ関 圭 / 小学館 / 2015-03-20
全く予備知識無く買い込み、読み始めて吃驚。恥ずかしながら全く知らなかったのだけど、この漫画家は70年代にデビュー、大変に寡作だが、その卓越した画力で知られる伝説的な作家なのだそうだ。確かに、これはすごい。この方、普段はなにしてはるんでしょう...?
うちの妻ってどうでしょう?(7) (アクションコミックス)
[a]
福満 しげゆき / 双葉社 / 2015-05-28
大好きな連載作だったのだが、残念ながら最終巻である由...
深夜食堂 14 (ビッグコミックススペシャル)
[a]
安倍 夜郎 / 小学館 / 2015-04-30
34歳無職さん 6 (MFコミックス フラッパーシリーズ)
[a]
いけだたかし / KADOKAWA/メディアファクトリー / 2015-05-23
アルテ 3 (ゼノンコミックス)
[a]
大久保圭 / 徳間書店 / 2015-06-20
闇金ウシジマくん 34 (ビッグコミックス)
[a]
真鍋 昌平 / 小学館 / 2015-06-30
ジゼル・アラン 5 (ビームコミックス)
[a]
笠井 スイ / KADOKAWA/エンターブレイン / 2015-07-15
コミックス(2015-) - 読了:「鼻紙写楽」「ジゼル・アラン」「闇金ウシジマくん」「アルテ」「34歳無職さん」「深夜食堂」「うちの妻ってどうでしょう」
鴨の水かき 2巻 (ビームコミックス)
[a]
空木 哲生 / KADOKAWA/エンターブレイン / 2015-06-15
すみれファンファーレ 5 (IKKI COMIX)
[a]
松島 直子 / 小学館 / 2014-10-30
めしばな刑事タチバナ 18 (トクマコミックス)
[a]
坂戸佐兵衛,旅井とり / 徳間書店 / 2015-06-30
あさひなぐ 15 (ビッグコミックス)
[a]
こざき 亜衣 / 小学館 / 2015-05-29
イノサン 9 (ヤングジャンプコミックス)
[a]
坂本 眞一 / 集英社 / 2015-05-19
それでも町は廻っている 14巻 (ヤングキングコミックス)
[a]
石黒正数 / 少年画報社 / 2015-05-30
コミックス(2015-) - 読了:「それでも町は廻っている」「イノサン」「あさひなぐ」「めしばな刑事タチバナ」「鴨の水かき」「すみれファンファーレ」
ふしぎの国のバード 1巻 (ビームコミックス)
[a]
佐々 大河 / KADOKAWA/エンターブレイン / 2015-05-15
イザベラ・バードの日本旅行を描く。面白いことを考えるものだ。
大奥 12 (ジェッツコミックス)
[a]
よしながふみ / 白泉社 / 2015-06-26
あれよ星屑 3 (ビームコミックス)
[a]
山田 参助 / KADOKAWA/エンターブレイン / 2015-06-25
きのう何食べた?(10) (モーニング KC)
[a]
よしなが ふみ / 講談社 / 2015-06-23
山賊ダイアリー(6) (イブニングKC)
[a]
岡本 健太郎 / 講談社 / 2015-06-23
うきわ 3 (ビッグコミックス)
[a]
野村 宗弘 / 小学館 / 2015-05-12
弟の夫(1) (アクションコミックス(月刊アクション))
[a]
田亀 源五郎 / 双葉社 / 2015-05-25
コミックス(2015-) - 読了:「弟の夫」「うきわ」「ふしぎの国のバード」「山賊ダイアリー」「きのう何食べた?」「あれよ星屑」「大奥」
6月頃から読んだ本の記録をさぼっていた。まずはコミックスから。
オールラウンダー廻(17) (イブニングKC)
[a]
遠藤 浩輝 / 講談社 / 2015-07-23
格闘技マンガなんだけど、リングに超人の類は登場せず、高校生やOLといったごく普通の人々の闘いを描く、面白いマンガ。もう17巻か... 月日の流れるのは速いなあ。
辺獄のシュヴェスタ 1 (ビッグコミックス)
[a]
竹良 実 / 小学館 / 2015-06-12
19世紀ドイツの修道院を舞台にした活劇。これが長編デビュー作だそうだ。すごいな。
ヴィンランド・サガ(16) (アフタヌーンKC)
[a]
幸村 誠 / 講談社 / 2015-06-23
逆流主婦ワイフ 1 (ビームコミックス)
[a]
イシデ 電 / KADOKAWA/エンターブレイン / 2015-05-25
僕だけがいない街 (6) (カドカワコミックス・エース)
[a]
三部 けい / KADOKAWA/角川書店 / 2015-07-04
スティーブズ 2 (ビッグコミックス)
[a]
/ 小学館 / 2015-06-12
アイアムアヒーロー 17 (ビッグコミックス)
[a]
花沢 健吾 / 小学館 / 2015-05-29
コミックス(2015-) - 読了:「オールラウンダー廻」「辺獄のシュヴェスタ」「ヴィンランド・サガ」「逆流主婦ワイフ」「僕だけがいない街」「スティーブズ」「アイアムアヒーロー」
2015年8月14日 (金)
Bass, F.M., Bruce, N., Majumdar, S., Murthi, B.P.S. (2007) Wearout effects of different advertising themes: A dynamic Bayesian model of the advertising-sales relationship. Marketing Science, 26(2), 179-195.
仕事の都合で状態空間モデルのことを考えていて、分析例がほしくて手に取ったのだけれど、ぱらぱら読み始めたら、これが予想をはるかに超えて大変面白くて...
読んでる最中に気が付いたんだけど、筆頭著者はあのBassモデルのBassさん。論文出版の前年にお亡くなりになった由。
著者らいわく。
世の中には広告反応モデルが山ほどある。それらはみなこう想定している:広告支出はあるメッセージなりテーマなりを伝播させるために使われているのだと。しかし現実には、企業は同時に複数のテーマについての広告を走らせる。異なるテーマの広告を同時に行うことにはどういう効果があるのか。広告効果逓減(wearout)はどう変わる? それをどうやって測る? 異なるテーマのあいだにはどんな相互作用が起きる? どうやって予算配分したらいい? これが本論文のテーマです。
先行研究レビュー。6項目に分けて整理する。
1. 反応モデル。初期のレビューとしてはLittle(1979, Op.Res.)が有名。いわく、集計レベルでの広告反応モデルには次の特徴が求められる。(1)広告効果の非線形性を捉えていること。(2)効果逓減・忘却を捉えていること。(3)競合の広告効果を考慮していること。(4)メディアとコピーの変化による広告効果の変化を捉えていること。[←うわあ... 実務で広告効果モデリングに携わっている方、結構耳が痛いんじゃないかしらん]
初期の反応モデルは広告支出と売上ないしシェアを結びつけた。さらに分散ラグモデルをつかってキャリーオーバーを捉えた[←たぶんKoyckモデルのことを指しているのだろう]。モデルは利益最大化の観点からの広告支出最適化にも用いられた。レビューとしてはVakratsas & Ambler (1999, Mgmt.Sci.)をみよ。これとは別に、反応関数は凹型かS字型かという議論もあった。理論モデル側はインパルスの効果をS字型に捉えているわけで、これは結構大事な話だ。
2. wearin/wareout。いろんな要因が効くことが分かっている(広告が感情訴求的か理性訴求的か、etc.)。Naik, Mantrala & Sawyer(1998, Mktg.Sci)いわく、wareoutには広告接触の反復によるものとコピー自体によるものがある。
3. 忘却。もちろんブランド認知率が下がるというネガティブな面もあるが、広告効果を再活性化させるというポジティブな面もある。実証研究もあるぞ。
4. テーマによるwearoutのちがい。感情的広告はwearoutしにくいという実証研究がある。
5. 時変係数の必要性。係数が時間とともに変化しちゃうにちがいないという点は昔から問題になっていた。時期ごとに推定するとか、ランダム係数モデルとか。
6. 交互作用の必要性。広告と他のマーケティングミクス変数(特に価格)との間に相互作用があることは古くから知られている。
提案モデル。
まず、Nerlove-Arrowモデルというのがありまして... 時点 $t$ における広告支出を $A(t)$、好意(goodwill)を$G(t)$として、
$\frac{dG(t)}{dt} = q A(t) - \delta G(t)$
$q$は広告効果で一定。$\delta$は忘却の効果である。
Naik et al.(1998)はこのモデルを拡張し、$q$を時変させてwearoutを表現できるようにした。こう考える。
$\frac{dq}{dt} = -a(A) q + (1-I(A)) \delta (1-q)$
ただし$a(A) = c + w A(t)$。$I(A)$は「いま広告中」のときに1。
[えーと、広告出稿中の$q$の傾きは $ -(c+wA(t))q$。つまり、その時点の広告支出$A(t)$に反復wearout係数$w$を掛け、コピーwearout係数$c$を足した奴が$q$の減衰率。いっぽう出稿期間が終わると、$q$の傾きは$-cq + \delta(1-q)$となる。つまり、直近の$q$に対し、コピーwearout係数$c$を減衰率として減衰がかかる。いっぽう、忘却係数$\delta$に$(1-q)$を掛けた値が毎瞬間に$q$に乗る。最後のがよくわからないな、なんで$(1-q)$だと考えるのだろう? 広告出稿停止後の$q$の回復が$q$が天井に達するまで続く、といいたいんだろうけど、その天井を1に決める理由がわからない]
我々はこれをさらに一般化する。広告テーマが$m$個あるとします。$t$の添字表記は省略。
$\frac{dG}{dt} = \sum_{i=1}^m \left( g(A_i) + \lambda_i \sum^m_{j \neq i} h(A_i, A_j) \right) - \delta G$
ここで$g(A_i) = \ln(1+A_i), h(A_i, A_j) = \ln(1+A_i) \ln(1+A_j)$ と仮定します[はい来ましたよ、しれっとすごい仮定が来たよ!]。セミログモデルはこの分野ですごく一般的な仮定です。交互作用係数を結局テーマごとに一つしか推定しない[$\lambda_i$のことね]けど、これは倹約性の問題です。
広告効果の時間変化は、Naik et al.(1998)と同様に
$\frac{dq_i}{dt} = -a(A_i) q_i + (1-I(A)) \delta (1-q_i)$
$a(A_i) = c_i + w_i A(t)$
$\frac{dq_i}{dt}$はテーマ間で独立とします。
これをDLM(動的線形モデル)として、Gibbsサンプリングで推定します。
分析例。あるテレコム企業の電話サービスのデータ。この会社は固定電話で独占状態にあり、競合は携帯電話である。
週次で分析する。従属変数は、固定回線の国際通話を除く総通話時間。共変量は、通話時間あたり平均価格、回線数、競合の広告支出。
さて、この会社の広告支出を5つのテーマに分ける:{利用促進、製品オファー、価格オファー、リコネクト、リアシュアランス}。すべてGRPで測定。
モデル推定。ここ、ちょっと関心があるので細かくメモをとろう。原文と感想を分けて書くのが面倒になってきたので、ここからは一緒に書く。
時点$t$における総通話時間$y_t$について、
$y_t = G_t + \beta' X_t + \epsilon_t$
原文は$\beta$を転置させてないけど、あとの式との整合性を考えると誤植だと思う。
$G_t$は好意(goodwill)。$X_t$は3つの共変量のベクトル。誤差は$\epsilon_t \sim N(0, \sigma^2_\epsilon)$とするが、著者いわく、ここには内生性があるかも。誤差項にはそこにはたとえば携帯電話サービスの成長といった因子が含まれているだろうし、かつその因子についての企業の知覚が価格に影響しているかもしれない。そこで、操作変数$W$を使ってこう定式化する。小売価格指標、世帯数、消費者センチメント、世帯支出を道具変数として
$p_t = p_t (W; \alpha) + \eta_t$
うーむ、この表記、理解できない。$\alpha$ってなんだ。操作変数法の特殊な表記なのかしらん...
状態空間表記に書き直す。
まずは測定方程式。
$y_t = F_t \Phi_t + \beta' X_t + \epsilon_t$
これはまあ楽勝ですね。$F_t$は長さ$m+1$の横ベクトルで、最初の要素が1, あとは0。$\Phi_t$は長さ$m+1$の縦ベクトル、要素は上から順に$G_t, q_{1t}, q_{2t}, \ldots, q_{mt}$。$\epsilon_t \sim N(0, \sigma^2_\epsilon)$。
はい深呼吸。状態方程式は
$\Phi_t = H_t \Phi_{t-1} + u_t + w_t$
簡単なところから片付けよう。
$w_t$は長さ$m+1$のベクトルで、$w_t \sim N(0, W)$。たぶんNじゃなくてMVNと書くべきところだ。Wは対角行列のはず。
$u_t$は長さ$m+1$のベクトルで、さっき定式化した$q_t$の差分方程式の第二項を表している。$\Phi$の一番上には$G_t$が入っているから、上から順に、$0, \delta(1-I(A_{1t})), ..., \delta(1-I(A_{mt}))$となる。ここ、原文に誤植があると思うので勝手に直した。
ああ、ついに来てしまった。$H_t$はサイズ$(m+1, m+1)$の遷移行列。しょうがない、ゆっくりみていこう。
$H_t$の一行目、左から順に、$(1-\delta), \bar{g}(A_{1t}), \ldots, \bar{g}(A_{mt})$。最初の奴は、Nerlove-Arrowモデルの第二項。二番目以降は、
$\bar{g}(A_{it}) = g(A_{it}) + \lambda_i \sum^m_{j \neq i} h(A_{it}, A_{jt}) $
関数$g(\cdot), h(\cdot)$は上で定義済み。ああそっか、$A_i, A_j$は広告GRPそのもの、データから得る定数で、だから推定するパラメータは$\lambda_i$だけなのか。
$H_t$の二行目。二列目にしか式が入らず、あとは0。各広告テーマの効果を表す状態変数は、一次の自己回帰はするけど、クロスラグは持ってないわけね。で、二列目にはいっているのは...
$(1-a (A_{1t})) - \delta(1 - I(A_{1t}))$
上で定義した$q$の差分方程式がそのまま入っているのね。なるほど。
$H_t$の三行目は三列目にしか式が入らない。以下同様。
さあここまで来ると、あと決めなきゃいけないことは、
- $H_t$のなかのパラメータ, $\Lambda = \delta, \{c_i, w_i, \lambda_i\}_{i=1}^m$の事前分布。
- $\beta$の事前分布。
- $\sigma^2_\epsilon, W$の事前分布。
- $\Phi_0$の初期推定。以下、これを$D_0$と呼ぶ。
どうにか決めまして(付録参照とのこと)、MCMCで推定しました、とのこと。これ、カルマンフィルタじゃ推定できないのかなあ...
識別性のチェックとか、内生性の問題をどう処理したかとか、説明があったけど、省略。
結果。
提案モデルと、テーマ間交互作用を抜いたやつ、GRPを全テーマで足し挙げて使う奴、GRPの(対数じゃなくて)平方根を取る奴、線形に扱う奴、を推定。ベイズ・ファクター、予測成績(MADとMSE)、予想成績(60週と100週使ってモデル組んだときのMAPE)を比較。いずれも圧勝。
共変量では、価格と回線数が効いた。競合の広告は効かなかった。まあ固定回線市場じゃ独占状態だからね、とのこと。
忘却率$\delta$は0.037。コピーwearout効果 $c_i$は0.16から0.57 [でかいなあ]、いずれも有意。反復wearout効果$w_i$はいずれも負になった。この会社は広告を頻繁に変えているので反復wearoutが起きず、むしろwearinになっているのでは、とのこと。
クリエイティブの中身を押さえたわけじゃないんだけど、価格オファー広告と製品広告は理性訴求っぽく、残りの3つは感情訴求っぽいと思われる。実際、前者はコピーwearoutが大きかった。云々。
交互作用効果はみな負。つまり、異なるテーマの広告は互いの効果を軽減してしまう模様。
広告予算最適化という観点からいうと... [全時点・全テーマの$A_{ti}$を動かして$E(y_t | D_{t-1})$の全時点を通じた合計を最大化する、という非線形最適化問題を解いて見せている。さすがにここまでくると数字の遊びだという気がするので、省略]
考察。このモデルの限界は、広告を外生変数としてみているところ。今後の拡張の方向としては、コピーごとの最適化とか[そうそう、別に$A_{ti}$の最適値を$t$ごとに決めるこたあないだろうと思った]、メディアへの投資配分とか、テーマxメディアの交互作用とか。
。。。いやー面白かった。マーケティング・ミクス変数間の交互作用が、集計レベルの市場反応時系列モデルからわかるってわけね。それも効果逓減率を変数ごとに推定し、さらに各変数の効果を時変させながら。すごいじゃん。
それもこれも、広告効果についてかなり強気な制約をかけているからなんだけど。よくよく眺めていると、実際に推定しているパラメータの中に、時変パラメータは実はひとつもないのだ。
このモデル、ほんとにMCMC使わなきゃだめかしらん。カルマンフィルタで最尤推定できちゃうような気がするんですが、気のせいでしょうか?
こうしてみると、いやーマーケティング・サイエンスってのもなかなか面白いじゃんか、と思うのだが、しかし教育産業のテスト部門でお世話になっていたときは「うわあ教育評価って面白い!」と思ってたし、その前はその前でそのときやっていたことが面白かったし... それに、いま20代のまっさらな状態にタイムスリップして「さあなにやりたい?」と訊かれたら、やっぱり心理学だか哲学だかを選ぶだろう。宿命ってやつですね。
論文:マーケティング - 読了:Bass, Bruce, Majumdar, Murthi (2007) 異なるタイプの広告を同時に出稿していると何が起きるかを推定する、それも個人データじゃなくて集計データで
2015年8月13日 (木)
福元圭太 (2013) フェヒナーにおける光明観と暗黒観の相克:グスタフ・テオドール・フェヒナーとその系譜(5). かいろす, 51, 18-39.
心理学の教科書に必ず出てくるえらい人、精神物理学の父、そして19世紀ドイツの壮大な哲学者というか変人というかなんというか... かのグスタフ・フェヒナーの著作を丹念にたどる、九大のドイツ文学の先生による評伝連作、その第五弾。どうやら、2009年から年一本のペースで書き続けておられた模様(第三弾まで, 第四弾)。楽しみに拝読しております。
すでに古稀を迎えたフェヒナー先生、静かな老後をお送りかと思いきや、なぜか二十歳そこそこの学生と仲良くなり、自らの思想を俯瞰する著書「光明観と暗黒観の相克」の執筆に着手しちゃうのである。なおこの学生はジークフリート・リピナーという人、のちに作曲家マーラーの友達になるんだけど、マーラーの結婚相手に嫌われて絶交する羽目になるんだそうです。なに? それって映画「ベニスに死す」に出てくる主人公の友達?と早とちりしたんだけど、wikipediaによればあの友達のモデルは作曲家のシェーンベルクだそうです。ははは。
で、肝心の著書「光明観と暗黒観の相克」の中身ですが... うーん。汎神論思想ってんですかね。世界のあらゆるものが神の息吹だ、的な? 肉体は滅びても魂は不滅だ、みたいな? とにかくそういう本なんだそうです。何がすごいといって、この本をわざわざ探してきて読んだという著者の先生がすごい。ドイツ文学者おそるべし。
フェヒナー先生もいよいよ晩年を迎えましたが、この大河評伝シリーズはまだ続く由。第六弾が楽しみだ。
論文:その他 - 読了:福元 (2013) フェヒナー先生とその時代・晩年編
早川和彦(2014) 高次元時系列データ分析の最近の展開. 日本統計学会誌, 43(2), 275-292.
本数がすっごく多い多変量時系列データの分析手法について、経済時系列分析の観点からのレビュー。
細かいところ難しくてよくわかんないんだけど、自分なりに勉強になりましたです。
初歩的な疑問なのだけど、著者のおっしゃる「ファクターモデル」って、発達心理学だとかマーケティングだとかでたまに出てくる「動的因子分析」とどういう関係にあるのだろう。
えーと、わたくしの拙い理解によれば、世間で動的因子分析と呼ばれるものには次の2種類の定式化がある。
- ホワイトノイズ因子得点モデル(WNFSモデル)。ショック・モデルともいう。測定ベクトル $x_t$について
$x_t = \sum_{s=0}^S \Lambda_s f_{t-s} + e_t$ - 直接自己回帰因子得点モデル(DAFSモデル)。プロセスモデルともいう。ごくふつうの因子分析モデル
$x_t = \Lambda_0 f_t + e_t$
を考え、さらに$f_t$についての時系列モデルを考えるやつ。
さて、著者によれば、ファクターモデルには2種類ある。
- 静学的ファクターモデル。時点$t$における変数$i$の測定値について
$x_{it} = \lambda'_i F_t + e_{it}$
$\lambda_i, F_t$はサイズ$r \times 1$。$F_t$は静学的でもいいし、$A(L)F_t = u_t$というように動学的でもよい。ただし$A(L)$はラグ多項式で$u_t$はiid。$e_{it}$と$e_{jt}$のあいだに相関を設けない場合をstrict factor model, 弱い相関を許す場合をapproximate factor modelという。 - 動学的ファクターモデル。
$x_{it} = \lambda'_i(L) f_t + e_{it}$
$\lambda_i(L)$は$\lambda_{i0}, \lambda_{i1}, \ldots, \lambda_{is}$(それぞれサイズ$q \times 1$)からなるラグ多項式。$f_t$はサイズ$q \times 1$で、$f_t = C(L) \epsilon_t$という動学構造を持つ。ただし$C(L)$はラグ多項式で$\epsilon_t$はiid。
... うーむ。
著者のいう静学的ファクターモデルって、因子負荷$\lambda_i$にラグがはいっていないから、きっとDAFSモデルに近いんだろうな。しかしDAFSモデルは因子得点について自己回帰構造を考えるけど、静学的ファクターモデルはそうでない場合を含むのであろう。
著者のいう動学的ファクターモデルはWNFSモデルに近いのかな、と思ったけど、WNFSモデルは因子得点がホワイトノイズ過程だと考えるのに対し、動学的ファクターモデルはたとえば因子得点が自己回帰するようなのも含むのだろう。
要するに、分類のしかたがちょっとちがうんだろうな。
論文:データ解析(2015-) - 読了:早川 (2014) 高次元時系列データ分析手法レビュー
Brandt, P.T., Freeman, J.R. (2006) Advances in Bayesian time series modeling and the study of politics: Theory testing, forecasting, and policy analysis. Political Analysis, 14 (1): 1-36.
第一著者はRのMSBVARパッケージの開発者。政治学におけるベイジアン時系列モデリングの進展にそれほど関心があるわけじゃないんだけど(すいません)、パッケージを使う前の儀式のようなものである。
第一部、レビュー。多変量時系列モデルによる政治学理論の検証と政策分析を、3つの領域について概観する。そもそも多変量時系列モデルについてよく知らない人は、この論文を読む前に勉強するように。[って、ほんとにそう書いてある。つれないなあ]
その一、innovation accounting。ある時系列におけるあるショックがほかの時系列に及ぼす影響を特定すること[←へええ。「イノベーション会計」と訳すらしい]。そのためにはインパルス応答を調べるわけだけど、理論検証という観点からは信頼区間が重要になる。しかし、残念ながら政治学ではあまり信頼区間を用いないし、求めるのも大変[いろいろ細かい議論があるけどパス]。最近ではSims & Zha (1999 Econometrica) が良い方法を提案している。
その二、予測による理論検証。VARモデルは過適合しちゃうことが少なくない。80年代にこれに対処するためにいろいろな信念をいれたベイジアンVARモデルが構築され、いわゆるミネソタ事前分布として知られている[←はああ?と思ったが、ミネソタ大関係者によるベイジアンVARモデル構築の有名な手法があるらしい。知らんがな]。しかしマクロ経済についての実質的信念とは整合しない点があって、Sims-Zha事前分布というのが提案されてて、どうのこうの。
ベイジアン時系列モデルは非定常性に強い。Sims-Zha事前分布はこの点でも優れていて、どうのこうの。
なお、以下の点に注意。(1)予測の正確さの評価方法はいろいろある。(2)Sims-Zha事前分布のハイパーパラメータがマクロ経済現象に基づき用意されており、「参照事前分布」として知られている。こういうのを政治学でも作りたいものだ。(3)ベイジアンでも理論的な構造を取り入れることが大事。
その三、反事実分析による理論検証。条件つき予測によって、ある変数が生じるためにはどんな条件が必要かを調べるのだ、とかなんとか。こういう分析が現実的かという点については議論がある[←ルーカス批判みたいなもの?]。でも反論もあって、云々、云々。
第二部、ベイジアンVARモデルの技術的詳細。正直、推定量の導出から難しくなって全くわけわかんなくなり、断念。
第三部、事例。読めばわかりそうだけど、力尽きたのでパス。
というわけで、全体の数分の一しか読めてないけど、記録の都合上、読了にしておく。まあいいさ、儀式だしね!
残念だけど、私にはちょっと難しすぎる論文であった。政治学だと思って舐めてました。というか、ベイジアンVARだけじゃなくて、政治学の研究について知っていないとわからん論文であった。
論文:データ解析(2015-) - 読了:Brandt & Freeman (2006) ベイジアンVARモデリング in 政治学
Barnett, L., & Seth, A.K. (2015) Granger causality for state space model. Physical Review. E, Statistical, Nonlinear, and Soft Matter Physics. 91(4).
みなさん、グレンジャー因果性はVARモデルの専売特許だと思っていませんか(はい、そう思ってます)。ブブーッ、そうではありません(へー、そうなんですか)。状態空間モデルからグレンジャー因果性を求めるやりかたを示しましょう(はあ、そうですか)。という論文。なにかの気の迷いで読んだ。
以下の状態空間モデルを考える。
状態方程式 $x_{t+1} = A x_t + u_t$
測定方程式 $y_t = C x_t + v_t$
$u_t, v_t$は平均0のホワイトノイズ過程で、共分散行列はそれぞれ$Q$と$R$、$u_t$と$v_t$の共分散行列は$S$とする。$x_t, y_t$は弱定常とする。そのとき$A$の固有値の絶対値の最大値は1より小さくなる。$R$は正定値行列だと仮定する[あれ?ホワイトノイズなんだから$Q$と$R$は当然正定値行列なのでは?]。この$y_t$は定常なARMAモデルで表せるし、定常なARMAモデルはこの状態空間モデルで表せる。
以下、$y^{-}_{t-1} \equiv [ y^T_{t-1} \ \ y^T_{t-2} \ \ \ldots ]^T$と略記します[時点$t$からみた過去データってことっすね]。また、イノベーションを$\epsilon_t \equiv y_t - E (y_t | y^{-}_{t-1})$と表します。イノベーションの共分散行列を$\Sigma$と書きます。
グレンジャー因果性について。
$y_t$を次の3つの下位過程に分解できるとする。
$y_t = [ y^T_{1t} \ \ y^T_{2t} \ \ y^T_{3t} ]^T$
$y_t$から$y_{2t}$を削ったやつを$y^R_t$、そのイノベーションを$\epsilon^R_t$と書こう。
$y_{3t}$の下での$y_{2t}$から$y_{1t}$へのグレンジャー因果性とは、$E(y_{1t} | y^{-}_{t-1})$と$E(y_{1t} | y^{R-}_{t-1})$のちがいだ、といえる。グレンジャー因果性は$y_{2t}$を削ったことによって$\Sigma_{11}$が大きくなった程度、すなわち
$F_{y_2 \to y_1 | y_3} \equiv \ln \frac{|\Sigma^R_{11}|}{|\Sigma_{11}|} $
と定義できる。
さて... この論文では、この$F_{y_2 \to y_1 | y_3}$を状態空間モデルのパラメータから求める式が導出されるんだけど、そのプロセスと導出された式については省略。だって時間領域じゃなくて周波数領域の話になるんだもん。難しくてわかんないんだもん。読む気なくしたんだもん。
後半はシミュレーション。2変量AR(1)過程のデータを生成し、ARMAモデルと状態空間モデルをあてはめ、それぞれからグレンジャー因果性を求める。状態空間モデルから求めたほうが、バイアスが小さくなり検定力が上がるんだってさ。
... ふうん。
生まれながらの文科系、宿命的なパッケージユーザとしては、状態空間モデルのパッケージにグレンジャー因果性を求める機能がついてたらいいな、と思うのが関の山である。ついてたらいいな。
こういう話はさらに拡張できて、共和分過程でも、誤差分散に不等性があるモデルでも、パラメータが時変するモデルでも、非線形な状態空間モデルでも、グレンジャー因果について推論することができるでしょう、とのこと。ふうん。
論文:データ解析(2015-) - 読了;Barnett & Seth (2015) 状態空間モデルにだってグレンジャー因果性はあります
2015年8月10日 (月)
Pauwels, K., Currim, I., Dekimpe, M.G., Ghysels, E., Hanssens, D.M., Mizik, N., Naik, P. (2005) Modeling Marketing Dynamics by Time Series Econometrics. Marketing Letters, 15(4), 163-183.
マーケティングにおける計量経済学的時系列モデルのレビュー。いわばDekimpre & Hanssens (2000)のアップデート版といったところ。2004年の講演を基にしているのだそうだ。
面白かった点をいくつかメモ:
- MIDAS回帰 (Mixed Data Samplingの略)。測定頻度が異なる複数の時系列を一気にモデル化するのだそうだ。へー。触れるものすべて金に変えちゃうんですかね。
- Factor VAR モデル。説明を読むと動的因子分析のような話だが、どうちがうのかしらん。Pauwels et al.(2004) という学会発表が挙げられている。
- Lemmens et al. (2005 Int.J.Forecasting): 変数の数がすごく多いときのグレンジャー因果性検定。
- 政策の変化は計量経済モデルのパラメータ・構造を変えるので、変化前のパラメータ推定を政策変化のインパクトの評価に使うのはおかしい。これをルーカス批判(Lucas Critique)という。マーケティングにもこの批判はあてはまる。対策としては:
- 時変パラメータモデルは解決にはならない。パラメータが一定だという仮定が、反応関数が一定だという仮定にシフトしただけだから。
- インパルス応答関数の分析のように、政策変化がデータ生成過程を変えないという想定を明示的にする、というのがひとつの方向。
- 過去データで超外生性を検証するという路線もある[ルーカス批判があてはまるかどうかを調べる、という意味らしい]。例として Naik & Raman (2003 JMR)。
- モデルをリッチにする。構造VARモデルとか。
- 最近では手法がVARベースのモデルから拡張している。カルマン・フィルタを活用して、広告のwearoutをモデルに取り入れるとか(Naik et al, 1998 MktgSci)、交互作用効果を導入するとか(Naik, Raman, & Winer, 2005 MktgSci.)。周波数分解アプローチとか。階層ベイズ誤差修正モデルとか、ベイジアンVARとか。[た、助けて...]
- 時系列の分野は基礎概念の定義が意外に曖昧である由。たとえば、短期効果と長期効果とはなにか。インパルス応答関数が収束する値が長期効果だという人もいれば、インパルス応答関数の下面積が長期効果だという人もいる。弾力性は線形モデルで推定すんのか、log-logモデルで推定してもやっぱり弾力性なのか、とか。
- たとえ単位根検定を通過したって、市場反応におけるレジーム・チェンジがあると実質的に推論できることがある。その場合の方法としては、動的インパルス反応関数を使うとか、moving windowsを使うとか。
へー、いろいろあるのね...
論文:マーケティング - 読了:Pauwels, et al. (2005) マーケティングにおける時系列モデルレビュー in 2005
Willet, J.B., & Singer, J.D. (1988) Another cautionary note about R^2: Its use in weighted least-squrares regression analysis. The American Statistician, 42(3), 236-238.
著者があのWillet & Singerなので(縦断データ分析の名教科書の著者である)、資料整理のついでに目を通した。
えーと、かつてこの雑誌に Kvalseth (1985) "Cautionary Note about R2"というのが載った。OLS回帰におけるR二乗の定義にはいろいろあるんだよ、という話。Kvalsethさんいわく、切片項を抜いたり非線形だったりするような回帰モデルでは、R二乗は 全変動における残差平方和以外の変動の割合だということにしたほうがいいよ、とのこと。 [←式を見てパッとメモっているので誤解しているかも]
この論文はその話をOLSからWLSに拡張する。
WLS回帰では、
$Y = X \beta + \epsilon, \ \ \epsilon \sim (0, \sigma^2 W)$
というモデルを考える。Wは事前のOLSかなんかで得ることが多い。両辺に $W^{-1/2}$を掛けて
$W^{-1/2} Y = W^{-1/2} X \beta + W^{-1/2} \epsilon$
とすれば、$W^{-1/2} \epsilon$の分散は$\sigma^2 I$となり、OLSで推定できる。これを
$Y_* = X_* \beta + \epsilon_*$
と書くことにしよう。
さて、OLSの場合、Kvalsethさんお勧めのR二乗は
$R^2_{OLS} = 1 - \left[ \frac{(Y-X \hat\beta)' (Y-X \hat\beta)}{Y'Y - n\bar{Y}^2} \right]$
である。これをWLSにすると、パラメータのWLS推定値を$\hat\beta_*$として
$R^2_{WLS} = 1 - \left[ \frac{(Y_*-X_* \hat\beta_*)' (Y_*-X_* \hat\beta_*)}{Y'_* Y_* - n\bar{Y}_*^2} \right]$
ソフトが出力するR^2は普通これだ。往々にして$R^2_{OLS}$より高くなる。
でもこれは、$Y$そのものについての分散説明率ではなく、$Y$を変換した変数$Y_*$についての分散説明率である。そんなのヘンじゃないですか。ユーザにとっての残差はあくまで$Y - X \hat\beta_*$でしょ。
というわけで、WLSにおけるあるべき決定係数はこれだ:
$pseudo R^2_{WLS} = 1 - \left[ \frac{(Y-X \hat\beta_*)' (Y-X \hat\beta_*)}{Y' Y - n\bar{Y}^2} \right]$
これは$R^2_{OLS}$とそんなに変わらない。じゃどっちでもいいじゃん? とお考えの皆さん。わたくし云いたいのはですね、ソフトが出す$R^2_{WLS}$は高くなりすぎちゃって、素人はぬか喜びしちゃうんだ、ということです。云々。
WLSなんてあんまり使わないもんで、はぁさいですか、としかいえないんだけど...
先生方は、個々のデータ点がどんなウェイトを持っていようが、一旦出来上がったモデルの評価においてはそのことを無視して、すべてのデータ点を平等に扱うべきだ、と考えておられるのでしょうね。それはそれでひとつの見方だが、結局、それはウェイトがなにに由来しているかによって見方が変わってくるんじゃないかと思う。
たとえば、ウェイトが個々のデータ点の不均一分散性を表しているようなWLS回帰もあるだろう。そのときは先生方仰せのとおりかと。いっぽう、ウェイトがSAS的な分析ウェイト(「このデータ点は何人分のデータの集約値か」)を表しているようなWLS回帰もあるだろう。このとき、ウェイトが大きいデータ点とは、(単に分散が小さいというだけではなく)人数の多いデータ点なんだから、「ウェイトが小さいデータ点はうまく説明できなくてもいいや」的な発想に立った決定係数がほしいという立場もありうるのではないか。その立場からは$R^2_{WLS}$でオッケーなんじゃないかしらん?
論文:データ解析(2015-) - 読了:Willet & Singer (1988) 決定係数かくあれかし:WLSの巻
Dekimpe, M.G., Hanssens, D.M. (2000) Time-series models in marketing: Past, present and future. International Journal of Research in Marketing. 17, 183-193.
マーケティング・モデルにおける時系列モデルについての概観。仕事の都合で時系列データについて勉強していて、細かい話にうんざりしてしまったので、ラフな見取り図のようなものが欲しくて手に取った。
しっかし、2000年のレビュー論文をいま読むなんて、我ながら風雅というか、なんというか。
歴史。
時系列モデルが用いられる問題は大きく3つあった。
- 予測。
- 変数の時間的順序の特定(グレンジャー因果性が用いられる)。
- マーケティング変数の効果の特定(伝達関数分析)、ないしあるイベントの効果の特定(intervention analysys)。[←なにを指しているのかわからない。インパルス応答関数の分析かなあ]
こういう研究はデータ・ドリブンであった。つまり、標本ベースの自己相関関数とか交差相関関数とかで関数形を同定した(天下りにKoyckモデルを使うとかいうのではなくて)。
時系列モデルを使う研究の数はあまり多くなかった[著者らによる表によれば論文23本]。その理由は:
- 研究者が時系列モデルをよく知らなかった。
- データドリブンであることへの抵抗感があった。Koyckモデルなんかだと背後に広告効果についての実質的理論があるけど、時系列モデルにはない。
- 縦断データは手に入れにくかった。
- 時系列モデルが優勢になるような特定の分野がなかった。つまり、SEMにとっての顧客満足研究、離散選択モデルにとってのプロモーション研究のような分野がなかった。
最近の動向。
時系列モデルの使用は増えてきた。理由:
- ソフトの普及。
- 共和分分析と構造VARXモデルの登場。ただし、共和分分析はいまんところ探索的使用に限られている(長期均衡が成立しているかどうかに関心が向けられており、理論的に導出される特定の関係性があるかどうかを検証する例は少ない)。構造VARXモデルも同様で、理論ドリブンなモデリングはみあたらない。
- 時系列データが増えてきた。スキャナ・データとか。
- 長期変動から短期変動をうまく切り離す手法が整備された。単位根検定、共和分モデル、誤差修正モデル、persistence estimation[21本の論文を挙げている]。詳しくは以下を見よ:Franses(1998 IJRM), Bronnenberg et al.(2000 JMR)[←面白そう], Dekimpe & Hanssen (1999 JMR)。
研究アプローチも、単一データセットに基づく長期変動の記述から広がってきた:
- 複数カテゴリへの一般化、効率性の変動と理論ベース記述子との関連付け[理論に基づく説明変数系列を導入する、ということかなあ]。
- マーケティング支出の規範的ガイドラインの構築。
- マーケティング分野特有の検証の登場。市場シェアモデルにおける論理的整合性とか、プロモーション下での多重外れ値の存在とか[どういう意味だろう...?]
今後の動向。4点について論じます。
その1、スキャナ・データなどの充実に伴い、データのサイズがでかくなるだろう。これには4つの面がある。
(1)変数の数が増える。
グレンジャー因果性検定で変数を選択することが増えるだろう。ふつうグレンジャー検定は2変量でやるけど、そうすると検定の繰り返しになって重要な変数が落ちちゃうという点が危惧されるので、多変量モデルでやったほうがよい。でも今度はモデルの倹約性が失われる。
同時的な因果的効果については、事前知識で順序付けすることが多いけど、変数の数が多いとどうしても再帰的になってしまう。VAR残差をMVNと仮定して、関心ある変数へのショックの効果を推定する、というのがよいだろう。
長期的効果の解釈も難しくなる。N本の単位根時系列の間にはN-1個の共和分関係がありうるわけで、困ってしまう。
意識・選好などの態度変数が同じ間隔で手に入っちゃう場合も増えてくる。変数によって誤差の構造が違ったりして、難しくなるけど、新しい問題設定もでてくるだろう。短期的顧客不満は長期的売上に効くか、とか。
(2)時系列が長くなる。
推定は改善され、戦略的示唆はリッチになり、レジーム・チェンジについての検討が容易になる。Moving-window方式の回帰なりVARモデル、ないし時変パラメータのモデルが活躍するようになるだろう。
(3)時間間隔が短くなる。
その有用性は分野によって違うけど、たとえば、TV-CFへの反応の1時間ごとのデータをつかった伝達関数がつくれたら、広告管理へのインパクトは大きいだろう。
(4)累積のレベルが低くなる。
個々の消費者レベルとか、店舗レベルとか、SKUレベルとか。なお、同様の動向は選択モデルの分野にもある。新しい可能性が開けますね、云々。
[ここ、ちょっと面白いので細かくメモ] 累積のレベルが長期的推論に与える影響についてはよくわかっていないことが多い。Pesaran & Smith (1995 JEconSurveys) は、異質性のあるパネルを通じて累積して得た時系列について、仮にミクロのレベルで共和分関係があっても、共和分係数に異質性があるせいで、累積すると長期均衡の存在がわからなくなってしまうことがある、と指摘している。いっぽう、異なる店舗を線形に累積したデータにlog-logモデルを適用した上で得たインパルス応答関数が、線型モデルを適応した場合のそれと強く相関していたという報告もある(線型モデルのほうが累積によるバイアスに強いはず)。
その2、市場環境の変化が速くなるだろう。
市場反応についてのこれまでの知見はたいてい、定常だと想定されるデータに基づいていた。これからはそうはいかなくなる。とくに競合反応についての研究へのインパクトが大きい。たとえば、最近のメタ分析によれば、価格プロモーションへの競合反応においてもっとも支配的な形式は「なにもしない」である。21世紀のamazonとかの時代にそんなこといってられるか。
その3,マーケティングとファイナンスの関係に注目が集まるだろう。
たとえば、広告投資は売上に長期的インパクトをもたらすが短期的には利益を下げる。投資家側はマーケ活動への企業の関与を促進すべきか止めるべきか。企業価値については長期の時系列データがあるんだから、これからはこういう問題で時系列分析が使われるようになる。
その4,インターネット・データソースの勃興。云々。
最後のほうは話も駆け足、私も斜め読みになっちゃったけど、まあ読了ということで、次に行こう。
それにしても、ここでいう時系列モデルというのは基本的にはVARモデルというか、経済時系列分析の話なんですね。状態空間モデルのジョの字も出てこない。そういうもんすか。
論文:マーケティング - 読了:Dekimpe & Hanssens (2000) マーケティングにおける時系列モデルレビュー
2015年8月 4日 (火)
Krider, R.E., Li, T., Liu, Y, Weinberg, C.B. (2005) The lead-lag puzzle of demand and distribution: A graphical method applied to movies. Marketing Science, 24(4), 635-645.
一見したところ私とは関係ない話だけど、ひょっとしてこれ、仕事で使えるんじゃないか? と気になって目を通した。Google Scholar様的には、メジャー誌にも関わらず、被引用件数46。ううう。選球眼が問われるところですね。
需要が配荷を生んでいるのか、配荷が需要を生んでいるのか。これをlead-lag問題という。映画でいうと、需要(興収)が上映館数を決める面と上映館数が需要を決める面がある。このダイナミクスについての研究は少ないけど、映画会社にとっては大問題である(消費者にプロモーションすべきか、映画館主にプロモーションすべきか)。また、映画以外でもlead-lag問題は重要だ。
lead-lag問題の探求は難しい。実験ができれば素晴らしいが、なかなか難しい。最近ではグレンジャー因果性とか外生変数つきベクトル自己回帰(VARX)とかによる研究が出てきているが(Horvath et al. 2002 MktgLetters; Nijs et al. 2001 MktgSci, Pauwels et al. 2002 JMktgRes, Pauwels & Srinivasan 2004 MktgSci, Srinivasan et al., 2004 MgmtSci.)、あいにく映画の時系列は短いし非定常なので、グレンジャー因果性検定がうまくいかない。
そこで、時系列データをつかってlead-lagパターンを視覚化する方法をご提案します。
二本の時系列 $X_t$, $Y_t$について考えよう。たとえば広告と売上とか。
($X_t$, $Y_t$)を二次元にマップしてみよう(時点を布置して線でつなぐ)。仮にラグなしで完全に正相関してたら、軌跡は正の傾きを持つ直線になる。ラグがあると曲線になって、(正の相関だとして) 反時計回りに回る曲線になる。逆に$Y_t$が$X_t$をリードしているときは時計回りに回る。
この性質はいつでも成り立つ。
[著者らはまず単純な正弦波の例を示し、次にフーリエ変換で一般化しているが、どうやら理屈は話のポイントじゃなさそうなので省略。なお、脚注によれば、こういう図のことを物理とか電気工学とかではリサジュー図(Lissajous figures)というのだそうだ。Wikipediaによれば調布の電通大の校章になっている由。知らんがな。googleで引くと岩手県奥州市にリサージュ四季の抄という結婚式場があるらしい。知らんがな]
実験してみよう。
一様 iid 乱数系列を三角フィルタでスムージングする。それにリードなりラグなりをつけて第二の系列をつくる。スムーズネス(5点フィルタ, 9点フィルタ)、リードかラグか、リード/ラグのサイズ(1,2,4,6)、時系列の長さ(11点,6点)を操作。各セルで8回試行、計256組の2変量時系列ができる。で、それぞれについて図を作り、協力者に軌跡が時計回りか反時計回りかどちらでもないかを判断してもらった。リードのときに時計回り、ラグのときに反時計回りと判断された割合を正解率と呼ぶ。
正解率は93%~23%(11時点、5点フィルタ、ラグ4ないし6、というのが一番難しい)。ラグが大きいとき、スムーズネスが低いときに難しくなるが、時系列の長さはそんなに効かない。
これを2変量時系列のグレンジャー因果性検定と比較してみると、正解率は63%~0%。どの条件でも人間の目にぼろ負けする。[←いやー、それはそうでしょうね、この短さでは...]
ほかに、映画の上映館数と興収を模した非定常な5点時系列でもシミュレーション。グレンジャー検定よりすぐれている由。
最後に実データ分析。231本の映画の上映館数と興収の二変量時系列(週次)を使う。長さは平均12週。
それぞれの映画について、ラグ3までいれたVARXモデルでグレンジャー因果性を検定し、(上映館数←興収が有意か)x(興収←上映館数が有意か)で4通りの分類。前者は180本で有意、後者は106本で有意であった由。なんで全部まとめたランダム係数モデルを組まないかねえと思ったのだが、脚注によれば「どっちもあり」で終わっちゃう由。
次に、横軸を上映館数、縦軸を興収にとってそれぞれの映画の軌跡を描き、人の目で判断させると、(評定者によるが)180~190本が「時計回り」にみえる。つまり、視覚的には上映館数←興収であると示唆される。
。。。ううむ。。。これ、どうなのかしらん。。。
論文のロジックとしてそうせざるを得ないことはよくわかるんだけど、提案手法のベンチマークをグレンジャー因果性検定にするのはちょっと変な感じがする。よくわかんないけど、6時点かそこらの時系列でグレンジャー因果性を検討しようだなんて、ハナから無謀な感じがするんだけど。むしろ、「何も知らない人が図を見たときに、どっちがどっちに先行していると判断できるか」をベンチマークにするのが現実的ではないか。
で、提案手法は結局こういうことだ。横軸に配荷、縦軸に需要をとると、右が高い単調な曲線状の軌跡になる。それが時計回りだったら需要→配荷、反時計回りだったら配荷→需要と判断しましょう。
こういうとマジカルに聞こえるけど、もっと具体的に考えると、これは案外あたりまえの話なんじゃないかという気がする。たとえば、映画のようなライフサイクルの短い製品では、軌跡は右上から左下に滑り降りていく。それが下に凸な曲線だったら(時計回りだから)需要→配荷、上に凸な曲線だったら(反時計回りだから)配荷→需要だ、ということになる。でも、そのくらいの推論だったら、なにも知らない人だって思いつくんじゃないですかね? だって、「まず縦軸が落ち、遅れて横軸が落ちる」曲線じゃないですか。チャートを眺めれば、「ううむ、まず配荷が落ちて、すこし遅れて需要が落ちましたね。ということは配荷→需要なんじゃないですか」ぐらいのことは、誰だって思いつくんじゃない?
さらにいえば、シミュレーション実験での提案手法の正解率は、グランジャー因果性検定よりはましだけど、絶対値として優れているとは言いがたい。結局、現実的なベンチマーク(素人判断)と比べても、はたまた絶対値としてみても、提案手法の優位性は特にない、という切ない話になっちゃいそうだ。
ま、それはともかくとして、意外な視点の面白い論文ではあった。2変量時系列を散布図上の軌跡として描いて、「ふむ...左回りだ... 横軸が縦軸の原因になってませんかね」なんて呟いたら、ちょっとかっこいいかも。
論文:データ解析(2015-) - 読了:Krider, Li, Liu, Weinberg (2005) 需要が先か配荷が先か(ないし、左回りか右回りか)
Asparouhov, T., Muthen, B., Morin, A.J.S. (2015) Bayesian Structural Equation Modeling with Cross-Loadings and Residual Covariances: Comments on Stromeyer et al. Journal of Management, 41, 1561-1577.
Muthen & Asparouhov (2012)が提唱したベイジアンSEM(BSEM)に対するStromeyerらの批判論文に、Muthen一家がさっそく反論。Stromeyerらの主張である「確認的因子分析で小さな交差負荷を推定するのは避けろ」「独自因子の共分散を片っ端から推定するのはやめろ」に猛攻撃を加える。さあ歯を食いしばれ!
交差負荷について。
まず、彼らの「小さな交差負荷はモデル化するな」という主張はBSEMそのものへの批判にはなってない点に注意。[←そうそう、そうですよね]
さて、我々はこの主張に賛成しない。どの項目も有意味な情報とノイズの両方を含む。小さな交差負荷の項目だって有意味な情報を持っている。モデルはそれを明示すべきだ。サーストンのいう単純構造とは構成概念の評価を明確にするための原則であって、解が有意味かどうかを決めるガイドラインではない。
交差負荷をゼロに固定すると共通因子の共分散がインフレを起こす。そんなのたいしたことないはずじゃんと仰るが、いいえ、たいしたことあるんです。彼らが示しているのはただの意見、我々が示しているのはシミュレーションに基づく事実だ。
残差共分散について。
これも小さな交差負荷の話と同じだ。小さな情報事前分布を与えることで、モデルを保ちつつデータを調べるべし。まず残差共分散なしのCFAモデルを推定し、その結果を使った事前分布を与えよ。
残差共分散を自由推定するとどんなモデルでも適合してしまう、と彼らはいうが、これは誤り。理由:
- 事前分布を自由度が大きな逆ウィシャート分布にすれば、CFAが棄却されるときにはBSEMも棄却される。
- Muthen & Asparouhov(2012)で提案した事前分布の感度分析をやれ。[事前分布として与える逆ウィシャート分布の自由度を動かしても結果が動かないかどうか、という話ね]
- BSEMの目的はCFAモデルの確認ではなく。仮定されたCFAモデルとデータのあいだのずれの評価だ。
事前分布として与える逆ウィシャート分布の自由度をだんだん下げていけば、BSEMモデルは次第に無制約な共分散行列の推定に近づいていき、PPPは高くなり、モデルは棄却されなくなるだろう。これは制約を緩めたからであって、BSEMの欠点じゃない。
彼らはガイドラインがないとかいっているから、ここでガイドラインを示そう。[自由度を変えて様子を見る手順の紹介。略]
残差共分散推定の活用事例紹介。[どれも概要だけ。コードを公開しているんだと思う]
- 特定の項目の残差相関のせいで適合度が下がっているCFAモデルについて、そのことをみつける。
- 真のモデルは2因子なのに1因子にしちゃったとき、そのことをみつける。
- 真のモデルは1因子なのに2因子にしちゃったとき、そのことをみつける。
- 因子の数を減らし、かわりに少数の残差相関をいれたほうがいいという示唆を得る。
- ごく小さな残差相関を無視したせいでCFAモデルが適合しないという例。
まとめると、
- もし残差相関が実質的にも統計的にも有意だったら、CFAに含めるべし。
- 実質的にも統計的にも有意でなかったら、ゼロに固定すべし。
- 実質的には有意だが統計的には有意でなかったら、たぶん識別がプアでSEがでかくなってんだから、BSEMで事前分布の自由度を上げて制約すべし。
- 統計的には有意だが実質的には有意でなかったら、悩むところだが、ゼロだとみなし、まあこのCFAモデルは近似だよねと割り切るというのがひとつの方法。
なお、残差相関パラメータの推定は因子モデルの推定と絡み合っている。たとえば、CFAで残差相関をひとつだけモデル化し損ねているとして、BSEMではそのせいで複数の残差相関が出現する(問題の項目を中心に、他の項目も巻き添えを食う)。一番でかい残差相関だけを解放して様子を見るのが吉。
DICの話。彼らはDICよりBICを使えと主張しているが、むしろDICのほうがよい。[ふうん。いま関心ないのでパス]
最後に、Stromeyerらの分析例を再分析。[パス。いやー性格悪いなあ]
いやー、勉強になりました、導師... (平伏)
私もですね、Stromeyerさんたちの批判を読んだとき、交差負荷に関する論点は言いがかりに近いなと思いましたです。測定モデル構築というより尺度開発の俺セオリーを語っているんじゃなかろうかと。いっぽう、残差共分散に関する批判には危うく説得されちゃうところでした。残差共分散行列をまるごと推定したらいったいなにをモデル化しているんだかわかんなくなると思ったからですが、そうじゃないんですね導師、あくまでゼロの代わりに分散の小さな事前分布を与えて様子をみようって話なんですね。誠に申し訳ございません、不信心をお許しください。ついていきます導師... お背中流します導師...
論文:データ解析(2015-) - 読了:Asparouhov, Muthen, Morin. (2015) おまえら全然わかってないな、ベイジアンSEMってのはこうやって使うんだよ
2015年8月 3日 (月)
Pfaff, B. (2008) VAR, SVAR, and SVEC Models: Implementation within R package vars. Journal of Statistical Software.
Rのvarsパッケージのvignette。ベクトル自己回帰モデル(VAR)、構造ベクトル自己回帰モデル(SVAR)、ベクトル誤差修正モデル(VECM)、構造ベクトル誤差修正モデル(SVEC)をご提供いたします。
パッケージを使う前の儀式ということで目を通した。いちおう読了にしておくけど、難しくて分からない箇所が多い。。。悲しい。。。
なお、ARIMA, VARIMAならbase, dse, fArmaパッケージで可能、ベイジアンVARならMSBVARパッケージで可能、とのこと。
論文:データ解析(2015-) - 読了:Pfaff (2008) Rのvarsパッケージ
2015年8月 1日 (土)
Stromeyer, W.R., Miller, J.W., Sriramachandramurthy, R., DeMartino, R. (2014) The prowess and pitfalls of bayesian structural equation modeling: Important considerations for management research. Journal of Management, 41(2), 491-520.
SEM-NETで紹介されていて、あわてて入手した。この雑誌のこの号は"Bayesian Probability and Statistics in Management Research"という特集号。この論文はかのMuthen導師が提唱するベイジアンSEM(BSEM)への批判論文である。仕事で頻繁に使っている手法であるから、他人事じゃないっす。
ここでいうベイジアンSEMとは、単にSEMをMCMCで推定することではなくて、Muthen & Asparouhov (2012, Psychological Methods)が提案した方法のこと。通常のCFAでは因子パターン行列にある程度ゼロを埋めるが、そのかわりに事前分布を与えまくり、常識的には到底識別できないモデルもMCMCで推定してしまう。EFAとCFAのあいだくらいの使い方ができる。
著者いわく...
BSEMのどこが優れているのか。Muthen & Asparouhov (2012), そしてその支持者である Fong & Ho (2013, Quality of Life Research), Golay et al. (2013, Psych.Assessment) の言い分はこうだ。CFAでは、小さな交差負荷 [cross-loading. 因子1を測定しているはずの項目が因子2に対して持っている因子負荷、という意味だろう]をゼロに固定する。これは不必要に強い仮定である。なぜなら、
- (主張1) 測定の道具というのはたいていそんなに正確ではないのであって、交差負荷をゼロに固定してよいという保証はない。
- (主張2) 理論との整合性という観点からいえば、交差負荷がゼロであろうが小さな値であろうがかわりはない。
- (主張3) 交差負荷をゼロに固定すると共通因子の共分散がインフレを起こす。
これらの議論はどれも論理的に欠陥がある。
(主張1)の問題点:
- 交差負荷は尺度開発が下手だったせいで生じているのかもしれない(ダブル・バーレル設問とか)。交差負荷をわざわざ推定することは、その下手さを誤魔化す(dust under the rug)結果になりかねない。[←この論点はよくわからないなあ。ある項目が因子2に対して負荷を持たないという誤った仮説を持っていたとして、BSEMなら交差負荷の推定値をみてその誤りに気づくことができる。通常のCFAならオムニバスな適合度なり個々の修正指標なりをみるところだが、果たしてその誤りに気づき得るか?]
- 測定の道具が不正確なせいで交差負荷が生まれているのならばその交差負荷は理論的重要性が低いわけで、なんだってそんなノイズをモデル化しないといけないのか。
- 測定が不正確かもしれないという理由で交差負荷の推定を許容すると、それはプアな測定を正当化するための脱出口になってしまいかねない。
(主張2)の問題点。そもそも因子分析ってのは、解釈容易な単純構造をみつけるためにやるものだ。だから、いくつかの項目が小さな負荷を持つような尺度を注意深くデザインする、なんてことは実際にはありそうにない。
[ううむ... ここまでのどの論点も、モデリングと尺度開発をごっちゃにした言いがかりのような気がするんですが... まあ先を読んでみよう]
(主張3)の問題点:
- たしかに、共通因子間の多重共線性は弁別的妥当性への脅威である。しかし、交差負荷のパラメータを推定しないと誤ったモデルになる、というのは本当か。それがただのノイズなら、たいした問題じゃないはずじゃん。むしろ弁別的妥当性が低いということが隠れてしまうことのほうが怖い。
- 共通因子に多重共線性が起きるのは、たいてい指標の信頼性が低いからだよね。指標をどうにかすうるのが先決じゃん。
- ほんとに因子間相関が高いんだったらbifactorモデルを組んだほうがよい。
話変わって...
- 情報的事前分布の正当化について。通常のCFAならパラメータは自由推定するか固定するかだが、ベイジアンSEMでは情報事前分布を与えるという選択肢も登場する。事前分布の特定はベイズ推論の肝なので、Gregory(2005 書籍), Kruschke et al.(2012 ORMの"The time has come"論文), Yuan & MacKinnon(2009 Psych.Methods), Zyphru & Oswald (この特集号) あたりをよく読め。
- 独自因子の共分散推定について。BSEMだと片っ端から推定できちゃうわけだが、そんなモデルは理論的な意味づけが難しいんじゃないかという批判もある(Rindskopf, 2012 Psych.Methods)。また、そんなモデルは絶対データに適合しちゃうわけで、モデルが根本的に間違っててもそれに気づけないわけだ(MacCallum et al., 2012 Psych.Methods)。
- 一般化可能性の喪失。BSEMはパラメータ数がすごく多いせいで標本抽出ノイズまで拾ってしまう。
とはいえ、BSEMが完全に有罪だというわけではなく、要は使い方に気をつけようねという話である。
実データ解析例。自己効力感についての尺度、5因子19項目のデータ。CFAとBSEMを比べる。ちゃんと読んでないのでメモは省略するけど、BSEMを何度か走らせてモデルを改善していくという話であった。
考察。BSEMの利用にあたっては以下の点に注意せよ。
- BSEMはプアな尺度開発の特効薬ではない。
- 単純構造を見失うな。まず、どの負荷が統計的に有意かを示せ[←この主張には批判がありそうだなあ...]。McDonaldに従って、標準化した負荷が0.30の奴に注目せよ。要するにだ、交差負荷に平均ゼロ, 分散小な事前分布を与えたBSEMをやってはい終わり、じゃなくて、なんとかして単純構造に持ちこめ。
- 多次元的指標(複数の因子に負荷を持つ指標)が本当に必要かどうか真剣に考えろ。次の順序で考えるとよい。
- (1)交差負荷は統計的に重要? Noなら推定するな。
- (2)交差負荷は実務的に重要? Noなら推定するな。
- (3)実務的に重要な交差負荷は理論的に正当化される? Noなら項目を削れ。[←ええええ] なお、理論的に正当化できる場合とはたぶん次の2つだ。(a)構成概念自体が多次元的で、下位次元もまた広範かつ相互に相関している場合。(b)指標が複雑な構造を持っている場合。たとえば、ある時間的ステージにおいて別の指標と共変し、意味内容においてはまた別の指標と共変する、というような場合は、意味内容の因子と時間の因子ができることになるわけで、多次元的指標を認めざるを得ない。
- (4)共通因子は独立したcluster basis(「俺にしか負荷を持っていない項目」)を持ってるか?Noなら項目を削れ。
- (5)項目はその概念をユニークな形で捉えているか? Noなら項目を削れ。
- (6)その項目の共通性は高いか? Noなら削れ。
- (7)"Do conditions make capitalization on chance more likely?" つまり、標本サイズが小さいとか、共通性が低い指標を使っているといった理由で交差負荷が生じているのではないか? Noなら交差負荷を認めるしかないし、Yesでも要検討。
- モデル構築にあたっては交差妥当化の原則を忘れるな。
- モデル選択にあたってははっきりした原則に従え。
- (1)PPCの信頼区間がゼロを含むか、という点に頼るのはやめろ。そんなの非現実的だ。
- (2)近似のdiscrepancyの指標として、PPC信頼区間とpSRMRを調べよ。
- (3)全体的なdiscrepancyの指標としてBICを調べよ(BIC_SSA, DICよりもおススメ)。
- (4)Burnham & Anderson (2004, Sociological Methods & Res.)に従ってモデルの事後確率を求めよ[←なんだそれは...]。
- reflectiveな多次元的構成概念のモデルでは、独自因子の共分散を推定するのはやめておけ。理由:(1)因子分析の目標は主要な共通因子の発見だから。(2)モデルの指定の誤りが吸収されちゃうから。(3)適合度が上がっちゃうから。
- BSEM支持者のいう正当化は信じるな。[←ははは。このくだり、いろいろ書いてあるけど疲れたので省略]
結論。要するにBSEMはデータの記述の方向に寄っている。この論文では検証可能なモデルの構築という観点からBSEMの柔軟性をどう生かすかという点について考えた。
... いやー。ざっと読んだだけだから理解できてないのかもしれないけど、全体を通して、尺度構成の話をしているのかデータ分析の話をしているのかが区別されていない感じで、読むのがちょっとつらかった。組織研究ってこういう雰囲気なのかしらん。
いっぽう、独自因子の共分散を片っ端から推定しちゃうのはやめとけ、というのはその通りだと思った。Muthenさんたちの論文にはそういうのが出てくるけど、あれは手法のデモンストレーションなんじゃないかと思う。
ベイジアンSEMについてはすでに2011年のPsychological Methodsでも議論の応酬があった模様。知らなかった。この論文にもMuthen一家からの反論論文が出ているらしい。
論文:データ解析(2015-) - 読了:Stromeyer et al. (2014) ベイジアンSEM、その剛勇とアキレス腱