論文:データ解析」カテゴリーアーカイブ

読了: Jacomy, et al. (2014) 俺たちが開発したForceAtlas2はネットワーク・グラフをどのように視覚化しているか

Jacomy, M., Venturini, T., Heymann, S., Bastian, M. (2014) ForceAtlas2, a Continuous Graph Layout Algorithm for Handy Network Visualization Designed for the Gephi Software. PLoS One, 9(6), e98679.

 たまに仕事の都合でネットワーク・グラフを描くことがあるんだけど、あれはホントに怖い。ノードの位置やエッジの太さ・色などの非本質的な視覚的要素によって、ユーザが図から受ける印象ががらっと変わってしまう。正直、データの視覚化手法としては危険すぎると思うこともある。
 ノードの位置を決めるアルゴリズムもいろいろあって困ってしまう。適切なアルゴリズムを選ぶのはなかなか難しいし、個々のアルゴリズムについて理解する時間も体力もないけれど、せめてよく使う奴については、中でなにをやっているのかを知っておきたいものだ。
続きを読む

読了:北條・岡田 (2018) アンカリング・ビネットを使って反応スタイルを分類する

北條大樹、岡田謙介(2018) 係留ビネット法による反応スタイルの分類:ヨーロッパの大規模健康調査を例に. 行動計量学, 45(1), 13-25.
 
 anchoring vignetteについての論文。以前ざっと目を通したんだけど、今回仕事の都合で再読。
続きを読む

読了: Tsai & Bockenholt (2002) 2レベル線形一対比較モデルの推定と識別性

Tsai, R.C, Bockenholt, U. (2002) Two-level linear paired comparison models: estimation and identifiability issues. Mathematical Social Sciences. 43, 429-449.

 もういいかげんうんざりしているのだけれど、ひきつづき一対比較の論文である。
 Thurstonian一対比較モデルの識別性について論じている Tsai(2003) で、ペア特有誤差の分散が一定なときの識別条件についてこの論文がreferされていたので、読んでみた。なお、Tsai(2003)ではペア特有誤差の分散を制約しない識別条件がこの論文に頼らずに示されているし、ペア特有誤差がないときの識別条件ならTsai(2000) にわかりやすい導出があるので、べつにこれを読む必要はないんだけど、毒も喰らわば皿まで、ということで…
続きを読む

読了: Tsai (2000) 順位付けデータに選好の個人差があるThurstonianモデルを当てはめるときの識別性について

Tsai, R.C. (2000) Remarks on the Identifiability of Thurstonian Ranking Models: Case V, Case III, or Neither? Psychometrika, 65(2), 233-240.

 サーストンの一対比較モデルを複数の回答者に拡張したときのモデルの識別条件について調べていたんだけど、そのものずばりであるTsai(2003)がなかなか難しく、著者の前の論文に遡って読んでみた。ここでは完全順位付け課題について考えており、選択誤差を考えないので話がよりシンプルである。
続きを読む

読了: Asparouhov & Muthen (2010) Mplusにおけるベイズ推定の内部事情

Asparouhov, T., Muthen, B. (2010) Bayesian Analysis Using Mplus: Technical Implementation. Mplus Technical Appendices.

 Mplusのベイズ推定についての技術資料。共分散行列の事前分布を指定する方法について考えていたらわけがわからなくなり、遡って読んでみた。いささか古いテクニカル・ペーパーなのでこれまで無視していたんだけど…
 膨大な内容のうちいま必要な部分に目を通しただけなので、実のところ読了とは言いがたいが、たぶん死ぬまで読み終えることはないだろうから、心の整理の都合上、読了ということにしておく。読了とはかくも柔軟な概念なのだ。
続きを読む

読了: Roy (2020) MCMC収束診断レビュー

Roy, V. (2020) Convergence Diagnostics for Markov Chain Monte Carlo. The Annual Review of Statistics and Its Application, 7(15), 1-26.

 仕事の都合でちょっと悩んだことがあって、現実逃避のために読んだ奴。
 題名通り、MCMCの収束診断についてのレビューである。正直、そんなに関心ある話題ではないのに、そしてすでにVats, et al.(2020), BDA3の該当部分を読んでいるのに、私にしては勉強熱心なことだ…
続きを読む

読了: Goncalves et al. (2017) BarkerアルゴリズムによるMCMC

Goncalves, F.B, Latuszynski, K., Roberts, G.O. (2017) Barker’s algorithm for Bayesian inference with intractable likelihoods. Brazilian Journal of Probability and Statistics. 31(4). 732-745.

 本来私なんかが読むような論文じゃないんだけど、ちょっと事情があって前半部分のみ目を通した。すいません、すいません…
 えーと、MCMCではイテレーションのたびに移動を受理するかどうか確率的に決めるじゃないですか。受理の確率を求めるために、MHアルゴリズムの場合だと密度比とかいう式を使いますわね。でもあの式の代わりに別の式を使おうという話があって、そのひとつとしてBarkerのアルゴリズムというのがあるのだそうだ。この論文はその解説。
 2023/04/18追記: arXivに上がってたドラフトを読んでたんだけど、公刊されているのをみつけたので、そちらを読み直した。
続きを読む

読了: Merkle, et al. (2021) blavaanパッケージはもはや潜在変数をサンプリングしないことにしたよ。Stanコードをいちいちコンパイルするのもやめたよ

 ここんところ仕事に家事に疲弊していて、残り時間はひたすらぼーっと過ごしていた。時間蠅は矢を好むということわざの通りである。(← 疲れているとろくなことを書かない)

Merkle, E.C., Fitzsimmons, E., Uanhoro, J. Goodrich, B. (2021) Efficient Bayesian Structural Equation Modeling in Stan. J. Statistical Software, 100, 1-22.

 Rのblavaanパッケージ、というのはつまりはSEMのための定番パッケージのひとつlavaanのベイズ版なんだけど、その紹介。実戦投入する前の儀式として読んだ。本論文の前にMerkle & Rosseel (2018, 同誌)というのがあるんだけど、そっちはめんどくさいのでパス。
 私はMplusの忠実な信者なので、lavaan/blavaanなど無視してMplusのみと戯れるシンプルライフを送りたいのだが、なかなかそうも云ってられない事情がある。
続きを読む

読了:Thompson (2018) サーヴェイデータ結合についてのレビュー

Thompson, M.E. (2018) Combining Data from New and Traditional Sources in Population Surveys. International Statistical Review, 87. S79-S89.

 これも仕事の都合で読んだ奴。サーヴェイデータをセンサスとか管理データと結合するという話のレビューである。
 Google様いわく、被引用回数12件。渋い.. 渋いなあ…
続きを読む

読了:Rao (2020) 非確率標本に基づく統計的推測手法レビュー

Rao, J.N.K. (2020) On Making Valid Inferences by Integrating Data from Surveys and Other Sources. Sankhya B: The Indian Journal of Statistics. 83, 242–272.

 これも仕事の都合で読んだ奴。非確率標本に基づく推測に焦点を当てたレビュー。
 ふだんなら読まないジャーナルだけど、著者が小地域推定で知られるラオ先生とあっては目を通さざるを得まい…と思った次第。
続きを読む

読了: Little(2011) Calibrated Bayesアプローチからみた欠損データ分析

Little, R. (2011) Calibrated Bayes, for Statistics in General, and Missing Data in Particular (with comments and a rejoinder). Statistical Science, 26(2), 162-186.

 統計学者Little先生があちこちで提案している Calibrated Bayes アプローチについて調べていて、その一環として読んだ奴。
 良く引用されるLittle(2011)は2012年にメモをとりながら読んでいたのだが、私には話が大きすぎ、いまいち雲をつかむような感じでよく分からなかった。この論文は「欠損データ」と問題が狭く指定されているので、もう少しわかりやすいかと思ったのだが…
続きを読む

読了: Sterba (2009) 母集団のモデルベース推論とデザインベース推論、そしてその統合

Sterba, S.K., (2009) Alternative model-based and design-based frameworks for inference from samples to populations: From polarization to integration. Multivariate Behavioral Research. 44(6), 711-740.

 仕事の都合で読んだ奴。心理学者のみなさん向けに、model-basedの統計的推論とdesign-basedの統計的推論を統合したアプローチを紹介するというもの。
 なお、本文中には統合的アプローチのためのソフトのレビューをonline appendixで提供していると書いてあるが、見当たらない(本文中のURLはリンク切れ)。Mplusとかが紹介してあったようだ。
続きを読む

読了: Elliot & Valliant (2017) 非確率標本に基づいて推測を行うふたつのアプローチ

Elliot, M.R., Valliant, R. (2017) Inference for nonprobability samples. Statistical Science, 32(2), 249-264.

 仕事の都合で読んだ奴。非確率標本からの統計的推測についての概観論文。
 市場調査実務家というのは「統計学の先生のいうことは無作為標本を前提とした綺麗ごとなので僕らの仕事にはあまり役立ちません」「それよりもビジネス理解が大事です」などと言い訳を繰り返していてもなんとかなる気楽な商売なのだが、実際には本論文のように仕事と直結する統計学の研究はたくさんあり、学びうることは多い。あまりに多い。真面目に考えるとなかなか辛い。言い訳を繰り返していた方が健康的かもしれない。
続きを読む

読了: Gelman (2007) ウェイティングと回帰モデリングを巡る悪戦苦闘 (質疑応答編)

引き続き、Gelman(2007) のメモ。

Gelman, A. (2007) Struggles with survey weighting and regression modeling. (with commentaries.) Statistical Science. 22(2), 153-164.

 論文に対して寄せられた5人の識者によるコメントと、Gelmanさんによる返答を読んでみた。
続きを読む

読了: Gelman (2007) ウェイティングと回帰モデリングを巡る悪戦苦闘 (8年ぶり2回目)

 仕事の都合でGelmanらのMRP(マルチレベル回帰・事後層別)についてちょっとだけお話しする機会があって、資料を準備していてふと気がついたんだけど、Gelmanさんが前に書いた”Struggles…”という面白い論文があった。あれはMRPの萌芽だったんじゃないだろうか。あの論文ではそうは呼ばれていなかったけど。

Gelman, A. (2007) Struggles with survey weighting and regression modeling. (with commentaries.) Statistical Science. 22(2), 153-164.

 私は2014年にメモをとりながら読み終えている。メモを読み返してみると、手法提案論文というよりはもっと大きな枠組みを提示した論文なのだが、確かに、MRPの基本アイデア(非確率標本に対する階層回帰と事後層別)が提示されている。
続きを読む

読了:Brown & Maydeu-Olivares (2013) 強制選択課題を用いているおまえらリサーチャーが項目反応理論を勉強しなければならない理由

Brown, A., Maydeu-Olivares, A. (2013) How IRT Can Solve Problems of Ipsative Data in Forced-Choice Questionnaire. Psychological Methods, 18(1), 36-52.

 もういい加減うんざりしてきたんだけど、Thurstonian IRTの論文をもう一本だけ。
続きを読む

読了: Tsai & Bockenholt (2011) 順位付け・一対比較をSEMで分析する、ついでに共変量も別の結果変数も組み込む

Tshi, R.C., Bockenholt, U. (2011) Understanding Choice Behavior Beyond Option Scaling Using Structural Equation Models. Journal of Data Science, 9, 427-444.

 またも一対比較の話。いいかげん飽きてきた…

 Maydeu-Olivares and Bockenholt(2005)を拡張し、順序づけデータの分析をSEMで分析する際に共変量とか含める、という主旨。
 流石に今回は、どんな話かだいたい見当がつくような気がするので、かなり端折ってメモする。
続きを読む

読了:Pritikin(2020) 人々に評価項目ごとにモノとモノとの一対比較をしてもらったデータで評価項目の探索的因子分析をする(RのpcFactorStanパッケージ)

Pritikin, J.N. (2020) An exploratory factor model for ordinal paired comparison indicators. Heliyon, 6.

 一対比較データを扱うRパッケージのひとつにpcFactorStanというのがあって、その元論文。このパッケージを使うつもりはあまりないんだけど、順序尺度の一対比較データから刺激の個人効用を推定する、それもStanで… という点には大いに関心があるので、試しに目を通してみた。
 掲載誌は初めて見たけど、オープン・アクセス・ジャーナル。版元はCell Pressだから、そんなに変な雑誌ではない…と思いたい。
続きを読む