論文:データ解析」カテゴリーアーカイブ

読了:Rao (2020) 非確率標本に基づく統計的推測手法レビュー

Rao, J.N.K. (2020) On Making Valid Inferences by Integrating Data from Surveys and Other Sources. Sankhya B: The Indian Journal of Statistics. 83, 242–272.

 これも仕事の都合で読んだ奴。非確率標本に基づく推測に焦点を当てたレビュー。
 ふだんなら読まないジャーナルだけど、著者が小地域推定で知られるラオ先生とあっては目を通さざるを得まい…と思った次第。
続きを読む

読了: Little(2011) Calibrated Bayesアプローチからみた欠損データ分析

Little, R. (2011) Calibrated Bayes, for Statistics in General, and Missing Data in Particular (with comments and a rejoinder). Statistical Science, 26(2), 162-186.

 統計学者Little先生があちこちで提案している Calibrated Bayes アプローチについて調べていて、その一環として読んだ奴。
 良く引用されるLittle(2011)は2012年にメモをとりながら読んでいたのだが、私には話が大きすぎ、いまいち雲をつかむような感じでよく分からなかった。この論文は「欠損データ」と問題が狭く指定されているので、もう少しわかりやすいかと思ったのだが…
続きを読む

読了: Sterba (2009) 母集団のモデルベース推論とデザインベース推論、そしてその統合

Sterba, S.K., (2009) Alternative model-based and design-based frameworks for inference from samples to populations: From polarization to integration. Multivariate Behavioral Research. 44(6), 711-740.

 仕事の都合で読んだ奴。心理学者のみなさん向けに、model-basedの統計的推論とdesign-basedの統計的推論を統合したアプローチを紹介するというもの。
 なお、本文中には統合的アプローチのためのソフトのレビューをonline appendixで提供していると書いてあるが、見当たらない(本文中のURLはリンク切れ)。Mplusとかが紹介してあったようだ。
続きを読む

読了: Elliot & Valliant (2017) 非確率標本に基づいて推測を行うふたつのアプローチ

Elliot, M.R., Valliant, R. (2017) Inference for nonprobability samples. Statistical Science, 32(2), 249-264.

 仕事の都合で読んだ奴。非確率標本からの統計的推測についての概観論文。
 市場調査実務家というのは「統計学の先生のいうことは無作為標本を前提とした綺麗ごとなので僕らの仕事にはあまり役立ちません」「それよりもビジネス理解が大事です」などと言い訳を繰り返していてもなんとかなる気楽な商売なのだが、実際には本論文のように仕事と直結する統計学の研究はたくさんあり、学びうることは多い。あまりに多い。真面目に考えるとなかなか辛い。言い訳を繰り返していた方が健康的かもしれない。
続きを読む

読了: Gelman (2007) ウェイティングと回帰モデリングを巡る悪戦苦闘 (質疑応答編)

引き続き、Gelman(2007) のメモ。

Gelman, A. (2007) Struggles with survey weighting and regression modeling. (with commentaries.) Statistical Science. 22(2), 153-164.

 論文に対して寄せられた5人の識者によるコメントと、Gelmanさんによる返答を読んでみた。
続きを読む

読了: Gelman (2007) ウェイティングと回帰モデリングを巡る悪戦苦闘 (8年ぶり2回目)

 仕事の都合でGelmanらのMRP(マルチレベル回帰・事後層別)についてちょっとだけお話しする機会があって、資料を準備していてふと気がついたんだけど、Gelmanさんが前に書いた”Struggles…”という面白い論文があった。あれはMRPの萌芽だったんじゃないだろうか。あの論文ではそうは呼ばれていなかったけど。

Gelman, A. (2007) Struggles with survey weighting and regression modeling. (with commentaries.) Statistical Science. 22(2), 153-164.

 私は2014年にメモをとりながら読み終えている。メモを読み返してみると、手法提案論文というよりはもっと大きな枠組みを提示した論文なのだが、確かに、MRPの基本アイデア(非確率標本に対する階層回帰と事後層別)が提示されている。
続きを読む

読了:Brown & Maydeu-Olivares (2013) 強制選択課題を用いているおまえらリサーチャーが項目反応理論を勉強しなければならない理由

Brown, A., Maydeu-Olivares, A. (2013) How IRT Can Solve Problems of Ipsative Data in Forced-Choice Questionnaire. Psychological Methods, 18(1), 36-52.

 もういい加減うんざりしてきたんだけど、Thurstonian IRTの論文をもう一本だけ。
続きを読む

読了: Tsai & Bockenholt (2011) 順位付け・一対比較をSEMで分析する、ついでに共変量も別の結果変数も組み込む

Tshi, R.C., Bockenholt, U. (2011) Understanding Choice Behavior Beyond Option Scaling Using Structural Equation Models. Journal of Data Science, 9, 427-444.

 またも一対比較の話。いいかげん飽きてきた…

 Maydeu-Olivares and Bockenholt(2005)を拡張し、順序づけデータの分析をSEMで分析する際に共変量とか含める、という主旨。
 流石に今回は、どんな話かだいたい見当がつくような気がするので、かなり端折ってメモする。
続きを読む

読了:Pritikin(2020) 人々に評価項目ごとにモノとモノとの一対比較をしてもらったデータで評価項目の探索的因子分析をする(RのpcFactorStanパッケージ)

Pritikin, J.N. (2020) An exploratory factor model for ordinal paired comparison indicators. Heliyon, 6.

 一対比較データを扱うRパッケージのひとつにpcFactorStanというのがあって、その元論文。このパッケージを使うつもりはあまりないんだけど、順序尺度の一対比較データから刺激の個人効用を推定する、それもStanで… という点には大いに関心があるので、試しに目を通してみた。
 掲載誌は初めて見たけど、オープン・アクセス・ジャーナル。版元はCell Pressだから、そんなに変な雑誌ではない…と思いたい。
続きを読む

読了:Brown (2014) 一対比較・順序づけ課題のいろんな因子分析モデル・理想点モデルをひとつの枠組みで整理する

Brown, A.(2014) Item Response Models for Forced-Choice Questionnaires: A Common Framework. Psychometrika, 81(1), 135-60.

 先日より一対比較による個人差推定について延々考えているんだけど、もういい加減に飽きてきた…。
 これは参考になるかと思って読んでみた奴。
続きを読む

読了: Brown & Maydeu-Olivares (2012) 強制選択データのThurstonian IRTモデルをMplusで推定する

Brown, A., Maydeu-Olivares, A. (2012) Fitting a Thurstonian IRT model to forced-choice data using Mplus. Behavior Research Methods. 42(2).

 一対比較データからの個人効用推定の問題で延々と悩んでいる関係で、毒もくらわば皿まで、という気分で読んでみた奴。
続きを読む

読了:野々田・分寺・岡田 (2021) 一対比較で2因子を測定するときの推定方法

野々田聖一, 分寺杏介, 岡田謙介 (2021) 2因子を測定する一対比較型質問紙における推定法. 行動計量学, 48(2), 53-68.

 仕事の都合で延々と一対比較について考えているんだけど(官能評価みたいな古典的場面じゃなくて、むしろ効用の個人差を知りたいような場合の話)、もともとそんなに詳しいわけでも、すごく関心があるわけでもない話題で、正直、ちょっと疲れてきました。
 もっと心安らぐ話はないものだろうか… Web3.0とかさ… 知らんけど…
続きを読む

読了:Tsai(2003) 一対比較データに選好の個人差があるThurstonianモデルを当てはめるときの識別性について

Tsai, R.C. (2003) Remarks on the Identifiability of Thurstonian Paired Comparison Models under Multibple Judgments. Psychometrika, 68(3), 361-372.

 比較課題から刺激の効用を推定するときのモデルの識別性について悩むところ多く、なにかの足しになるかと思って読んでみた。先日読んだMaydeu-Olivares & Bockenholt(2005) で引用されていた論文。
続きを読む

読了: Bockenholt (2004) 比較判断で推定した効用に原点を持たせるための3つの工夫

Bockenholt, U. (2004) Comparative Judgments as an Alternative to Ratings: Identifying the Scale Origin. Psychological Methods, 9(4), 453-465.
 仕事の都合で悩むことがあって、なにかの足しになるかと思って読んでみた奴。
 比較課題や順位付け課題でもって刺激の効用というか評価を定量化したとき、常識的に考えるとその値の絶対的な大きさには意味がないんだけど、いやいや工夫すれば絶対的な大きさに意味を持たせることもできるんですよ、という論文。
続きを読む

読了: Burkner, Schulte, Holling (2019) 順位付けや一対比較課題の回答にThurstonian IRTモデルをあてはめて対象者の潜在特性を推定するのはどのくらい現実的なのか

Burkner, P.C., Shulte, N., Holling, H. (2019) On the Statistical and Practical Limitations of Thurstonian IRT Models. Educational and Psychological Measurement, 79(5), 827-854.
 Brown & Maydeu-Olivares (2011 Edu.Psych.Measurement)の後続研究らしい。ほんとは研究そのものにはあんまし関心なくて、RのthurstonianIRTパッケージについて知りたくてめくっただけなんだけど…
 あとで気がついたが、第一著者はRのbrmsパッケージ(Stanで回帰分析するパッケージ)の中の人だ。写真を拝見したところ若いお兄さんである。へええ。
続きを読む

読了:Mattos & Ramos (2021) 一対比較データのベイジアンBradley-TerryモデルをStanで推定するbpcsパッケージというのを作ったよ

Mattos, D.I., Ramos, E.M.S. (2021) Bayesian paired comparison with the bpcs package. Behavior Research Methods.
 題名のとおり、一対比較データをベイジアンモデルで分析しますという話。Rのbpcsパッケージの解説である。なにがどうベイジアンなのかを知りたくて目を通した。
続きを読む

読了:Maydeu-Olivares & Bockenholt (2005) 順位付け・一対比較データをSEMで分析する(というかMplusで分析する)

Maydeu-Olivares, A., Bockenholt, U. (2005) Structural Equation Modeling of Paired-Comparison and Ranking Data. Psychological Methods, 10(3), 285-304.

 仕事の都合で読んだ奴。
 順位付けや一対比較のデータをSEMのソフトで分析しましょう、という解説論文。supplementary materialとしてMplusのコードも用意されている。
続きを読む

読了:Luce & Tukey (1964) 同時コンジョイント測定

 コンジョイント分析について調べていて、そのご先祖として誰も彼もが頻繁に引用するLuce & Tukey (1964)による歴史的論文を、実は誰も読んでないんじゃないか、という疑念を持った。
 だってさ、どなたの紹介をよんでも、いまいち雲をつかむような感じで、その意義がいまいち腑に落ちないんだもん。だいたい、あの「コンジョイント測定」ってのは、60-70年代に存在した公理的測定理論という超難解な分野の概念であるはずだ。そんなのを理解できる人がそれほど多いとは思えない。そうですよね? そうだといってください。

Luce, R.D., Tukey, J.W. (1964) Simultaneous Conjoint Measurement: A New Type of Fundamental Measurement. Journal of Mathematical Psychology. 1, 1-27.
続きを読む

読了: Graffelman & Aluja-Banet (2003) 主成分分析・対応分析におけるsupplementary variableの求め方と品質評価

 先日の真夜中、データを図示するという地味な作業をコリコリとやっていて、あれ? これってなんだっけ? と混乱してしまったことがあった。

 個体変量行列でも集計表でもなんでもいいけど、とにかく行列\(X\)があるとするじゃないですか。これを列中心化して、主成分分析やって、各変数(\(X\)の列)の第一主成分負荷と第二主成分負荷を座標にして、変数を二次元空間にマッピングしたとしますよね。同時に、各ケース(\(X\)の行)の第一主成分得点と第二主成分得点を座標にして、ケースを二次元空間にマッピングしたとしますよね。
 そこに誰かがやってきて、ちょっとちょっと、\(X\)と同じ列を持ってる追加のケースがあるんだけどさ、その図に無理やり乗っけてくれない? と云ってきたとしよう。いいですよってんで、主成分負荷を変えずにその追加ケースの主成分得点を出してケースの図に乗せてあげる。こういうことはよくある。これをsupplementary caseなどという。
 また別の誰かがやってきて、ちょっとちょっと、\(X\)と同じ行を持ってる追加の変数があるんだけどさ、その図に無理やり乗っけてくれない? と云ってきたとしよう。いいですよってんで、この変数の主成分負荷を出して変数の図に乗せてあげる。こういうこともよくある。これをsupplementary variableなどという。
 ここで、あれれ、と混乱してしまったのである。俺なにやってんだ?
続きを読む