「論文：データ解析」カテゴリーアーカイブ

読了: 合崎・西村 (2007) 選択型コンジョイント分析の実験計画作成とパラメータ推定

合崎英男・西村和志 (2007) データ解析環境Rによる選択型コンジョイント分析入門. 農村工学研究所技報, 206, 151-173,

　選択型コンジョイント分析の実験計画作成・パラメータ推定についての手順解説。前に目を通していたのだけれど、このたび仕事の都合で選択型コンジョイント分析の実験計画作成について考えていて、メモを書いたりしていた関係で、ついでに再読した。
　第1著者の先生はこの後、選択型コンジョイント分析のRパッケージsupport.CEを公開し、日本語・英語で数多くの解説を書いておられるので、こんなに古いのを読むのは良くないのかもしれないけれど…
続きを読む →

読了: Davis, et al. (2021) カウント時系列モデリング・レビュー

Davis, R., Fokianos, K., Holan, S.H., Joe, H., Livsey, J., Lund, R. ,Pipiras, V. Ravishanker, N. (2021) Count Time Series: A Methodological Review. Journal of the American Statistical Association, 116(535), 1533-1547.

仕事の都合でカウント時系列について考えることになり、とりあえずRのtscountパッケージの解説に目を通したら、知らない話題がたくさんあることに気が付き、あわてて手に取った。
続きを読む →

読了: Liboschik, Fokianos, Fried (2017) カウント時系列の一般化線形モデル(tscountパッケージ)

Liboschik, T, Fokianos, K, Fried, R. (2017) tscount: An R Package for Analysis of Count Time Series Following Generalized Linear Models. Journal of Statistical Software, 82(5), 1–51.

　カウント時系列データ分析のRパッケージtscountの解説。このパッケージを実践投入する予定はないんだけど、カウント時系列の分析方法について知りたくて手に取った。
　本文だけで34ページある…
続きを読む →

読了: Ly, et al.(2017) 頻度主義・ベイジアン・MDLからみたフィッシャー情報量

Ly, A., Marsman, M., Verhagen, J., Grasman, R.P.P.P, Wagenmakers, E.J. (2017) A Tutorial on Fisher information. Journal of Mathematical Psychology, 80, 40-55.

　仕事の都合で選択課題の最適実験計画について調べていて、学力不足を痛感して読んでみた論文。題名のとおり、フィッシャー情報量だけに焦点をしぼったチュートリアルである。
　著者にWagenmakersさんが入っているから、頻度主義だけでなくベイジアンな話が出てくるのは予想がつくが、その2つに並ぶもう一つのパラダイムとしてMDLが出てくるところが、へええ？という感じである。
続きを読む →

読了: Glickman & Jensen (2005) 一対比較の適応的実験計画 by ベイジアン最適計画アプローチ

Glickman, M.E., Jensen, S.T., (2005) Adaptive paired comparison design. Journal of Statistical Planning and Inference, 127, 279-293.

　仕事の都合で一対比較法の実験計画の動的最適化について考えていて(なぜこんな柄にもないことを考えているのか…)、タイトルがそのものずばりだったのでめくってみた。Google様いわく被引用件数73件。この分野では多いのだろうか、少ないのだろうか。

　本論文はあいにくトーナメント戦の設計を考えていて(大相撲の15日間の各日の取り組み表を決めるというような状況)、私が抱えているところの、調査における刺激の心理量の一対比較測定という問題とは、いっけん乖離が著しいのだが、でも本質的には同じ話なんだろうなと思う。
続きを読む →

読了: Geyer (2011) MCMC入門 (中編)

Gayer, C.J. (2011) Introduction to Markov Chain Monte Carlo. in Brooks, S., et al. (eds) “Handbook of Markov Chain Monte Carlo“, CRC Press.

MCMC解説のメモ、第二弾。2回で終わるかと思ったのだが、全然終わんないぞ。今回は12-16節。
続きを読む →

読了: Geyer (2011) MCMC入門 (前編)

　仕事の都合でMCMCについて考えていて、マルコフ連鎖が目標分布に収束する理由がやっぱりわかんなくなってしまった。説明を読んだときには「よし理解した」と思うんだけど、いざちょっと応用的な問題になると、実は本当はよく理解できていないということに否応なしに気づかされるのである。

Gayer, C.J. (2011) Introduction to Markov Chain Monte Carlo. in Brooks, S., et al. (eds) “Handbook of Markov Chain Monte Carlo“, CRC Press.

　諦めてはなるまい、というので、MCMCについての分厚い論文集の最初に載っている解説の章を読んでみた。
　全17節。さあ深呼吸。
続きを読む →

読了: An & Ayala (1996) 環境評価法における支払意思額の混合分布モデル

An, Y., Ayala, R.A. (1996) A mixture model of willingness to pay distributions. SSRN.

　ちょっと訳あってパラパラめくった奴。記録のために読了としておくが、真面目に読んだわけではない。
続きを読む →

読了: Sonner, Aislie, & Otther (2007) コンジョイント分析で属性のWTPを推定したいとき、価格の効用を真面目に推定したほうが良いか、いっそ傾き1に固定しちゃった方が良いか

Sonnier, G., Ainslie, A., Otther, T. (2007) Heterogeneity distributions of willingness-to-pay in choice models. Quantitative Marketing and Economics, 5, 313–331.

　仕事の足しになるかと思って読んだ奴。Googleさんいわく被引用件数223。経済学の論文としては、これって多いほうなんですかね？
　最初なにいってんだかわかんなくなって混乱したんだけど、ここでいっているWTPというのは製品そのものに対する支払意思額のことではなく、価格以外の属性の部分効用の増分を価格に換算した値のことである(たとえば、同じ製品がブランドBじゃなくてAだったらいくら多めに払うか)。
続きを読む →

読了: Sisson & Fan (2011) 尤度を使わないMCMC

Sisson, S.A., Fan, Y. (2021) Likelihood-Free MCMC. in Brooks, S., et al.(eds) “Handbook of Markov Chain Monte Carlo,”, CRC Press.

　尤度フリーMCMCについての解説。いま仕事の関係で悩んでいることについて、ちょっとした手がかりでも得られるかも、と思って目を通した。高い本を買っちゃったから無理にでもモトを取らなくちゃ、というのがもう一つの動機である。
続きを読む →

読了: Chib & Greenberg (1995) Metropolis-Hastingsアルゴリズム解説

Chib, S., Greenberg, E. (1995) Understanding the Metropolis-Hastings Algorithm. American Statistician, 327-335.

　MCMCの古典的手法であるMetropolis-Hastingsアルゴリズムについての解説。Hitchcock(2003) によれば、この手法の普及させる立役者となった論文なのだそうだ。
　現在では日本語でも優れた解説が山のようにあるのに、いまになってこれを読んでいるのは無駄なような気もするんだけど… なんとなく目を通してしまった。
続きを読む →

読了: Hitchcock (2003) MCMCの歴史

Hitchcock, D.B. (2003) A History of the Metropolis-Hastings Algorithm. American Statistician, 57(4), 254-257.

　仕事の都合で柄にもなくMCMCについて調べているのだけれど、なにしろ数学の知識がないので到底歯が立たない。いったいボレル測度ってなによ!? どれだけ短期間に値上げできるかってことですか!? (それはぼれる速度だ)

　ついつい現実逃避で、こんなのを読んじゃったりして、メモまでとっちゃったりなんかして…
続きを読む →

読了：De’ath (2002) 多変量回帰木のご提案

　Rで決定木・回帰木モデルをつくるとき、標準のrpart::rpart()を使ってもいいし、他にもパッケージが山ほどある。なのに、巷の解説をみると、なぜかmvpartパッケージを使って説明していることが多い。すでに公開停止されたパッケージなのに、なぜか今でも広く使われているように思う。なぜだろう？そんなに使いやすいわけでもないんですけど。
続きを読む →

読了：Therneau, Atkinson & Mayo Foundation (2022) Rのrpartパッケージによる決定木・回帰木の舞台裏

Therneau, T.M., Atkinson, E.J., Mayo Foundation (2022) An Introduction to Recursive Partitioning Using the RPART Routines. Octover 21, 2022.

　決定木・回帰木を提供するRの標準パッケージrpartのビネット。たまにこのパッケージを使うとき、パラメータの意味を忘れちゃってて混乱するので、このたび目を通した。
続きを読む →

読了: Jacomy, et al. (2014) 俺たちが開発したForceAtlas2はネットワーク・グラフをどのように視覚化しているか

Jacomy, M., Venturini, T., Heymann, S., Bastian, M. (2014) ForceAtlas2, a Continuous Graph Layout Algorithm for Handy Network Visualization Designed for the Gephi Software. PLoS One, 9(6), e98679.

　たまに仕事の都合でネットワーク・グラフを描くことがあるんだけど、あれはホントに怖い。ノードの位置やエッジの太さ・色などの非本質的な視覚的要素によって、ユーザが図から受ける印象ががらっと変わってしまう。正直、データの視覚化手法としては危険すぎると思うこともある。
　ノードの位置を決めるアルゴリズムもいろいろあって困ってしまう。適切なアルゴリズムを選ぶのはなかなか難しいし、個々のアルゴリズムについて理解する時間も体力もないけれど、せめてよく使う奴については、中でなにをやっているのかを知っておきたいものだ。
続きを読む →

読了：北條・岡田 (2018) アンカリング・ビネットを使って反応スタイルを分類する

北條大樹、岡田謙介(2018) 係留ビネット法による反応スタイルの分類：ヨーロッパの大規模健康調査を例に. 行動計量学, 45(1), 13-25.
　
　anchoring vignetteについての論文。以前ざっと目を通したんだけど、今回仕事の都合で再読。
続きを読む →

読了: Tsai & Bockenholt (2002) 2レベル線形一対比較モデルの推定と識別性

Tsai, R.C, Bockenholt, U. (2002) Two-level linear paired comparison models: estimation and identifiability issues. Mathematical Social Sciences. 43, 429-449.

　もういいかげんうんざりしているのだけれど、ひきつづき一対比較の論文である。
　Thurstonian一対比較モデルの識別性について論じている Tsai(2003) で、ペア特有誤差の分散が一定なときの識別条件についてこの論文がreferされていたので、読んでみた。なお、Tsai(2003)ではペア特有誤差の分散を制約しない識別条件がこの論文に頼らずに示されているし、ペア特有誤差がないときの識別条件ならTsai(2000) にわかりやすい導出があるので、べつにこれを読む必要はないんだけど、毒も喰らわば皿まで、ということで…
続きを読む →

読了: Tsai (2000) 順位付けデータに選好の個人差があるThurstonianモデルを当てはめるときの識別性について

Tsai, R.C. (2000) Remarks on the Identifiability of Thurstonian Ranking Models: Case V, Case III, or Neither? Psychometrika, 65(2), 233-240.

　サーストンの一対比較モデルを複数の回答者に拡張したときのモデルの識別条件について調べていたんだけど、そのものずばりであるTsai(2003)がなかなか難しく、著者の前の論文に遡って読んでみた。ここでは完全順位付け課題について考えており、選択誤差を考えないので話がよりシンプルである。
続きを読む →

読了: Asparouhov & Muthen (2010) Mplusにおけるベイズ推定の内部事情

Asparouhov, T., Muthen, B. (2010) Bayesian Analysis Using Mplus: Technical Implementation. Mplus Technical Appendices.

　Mplusのベイズ推定についての技術資料。共分散行列の事前分布を指定する方法について考えていたらわけがわからなくなり、遡って読んでみた。いささか古いテクニカル・ペーパーなのでこれまで無視していたんだけど…
　膨大な内容のうちいま必要な部分に目を通しただけなので、実のところ読了とは言いがたいが、たぶん死ぬまで読み終えることはないだろうから、心の整理の都合上、読了ということにしておく。読了とはかくも柔軟な概念なのだ。
続きを読む →

読了：Vats & Gupta (2012) Rのmcmcseパッケージ

Vats, D., Gupta, K. (2021) An Introduction to Estimating Monte Carlo Standard Errors with R Package mcmcse.
　MCMC標準誤差を出力するRパッケージ mcmcse のvignette. 実戦投入前の儀式として読んだ。
続きを読む →

読書日記

読んだ本を淡々と記録します