論文」カテゴリーアーカイブ

読了: Hofstetter, et al. (2013) あなた最近エクササイズしてますか? Facebook上のあなたの友達にも裏をとり、答えが一致したら報酬をあげます

Hofstetter, R., Hildebrand, C., Herrmann, A., Huber, J. (2013) Revealing Painful Truths: the Impact of Friends on Self-Reports of Health-Related Behavior. Advances in Consumer Research, 41.

 仕事で探し物をしていてついでに目を通した奴。本文1ページ半、見出しも図表も空行も一切なく本文が切れ目なく続く。推敲もなんだかちょっといい加減な感じ。学会発表要旨なんじゃないかと思う。
続きを読む

読了:Islam (2011) 回帰分析でt検定したい人のための誤差項の正規性検定

うーん、最近めくった奴なのに、なぜ目を通したのか全然思い出せない… きっとそのときにはなにか事情があったんだろうけど…

Islam, T.U. (2011) Normality Testing: A New Direction. International Journal of Business and Social Science. 2(3), 115-118.
続きを読む

読了:Cribari-Neto & Zeleis (2010) Rのbetaregパッケージでベータ回帰分析

 なんというか、たまにSNSとかwebの記事なんかをみると、大企業のデータサイエンティストなる華やかな人々がビジネスへの貢献について華やかに語っておられて、彼我のちがいにちょっと目眩がすることがある。ああいう人たちってふだんなに食ってんだろうか。ステーキとかかな。なんか知らん横文字の料理とかかな。すくなくとも私みたいに冷やご飯にのりたま振って流しのまえで立ち食いしたりはしないんだろうな。知らんけど。

 まあとにかく、きっと皆さん私の知らないことをたくさん知っているので、たとえば目的変数がなにかの割合であるようなデータを渡されて回帰分析する羽目になったときも(突然に卑近な話になる)、きっとなにか私の知らない先端的な手法を使うのだろうなあと思う(いやいや、アシスタントに丸投げするんでしょうね)。いっぽう私はそのたびにこうジクジクと悩むわけです。毎度毎度binomial-logitでGLMしてていいの? たまにはなんかこう気の利いた誤差分布とかないわけ? 元の観察数がわかんなかったらロジット変換してOLSでいいの? なんかもっとパンクな手法はないわけ? とかなんとか。あーあ、残念な人生だ。

Cribari-Neto, F., Zeleis, A. (2010) Beta Regression in R. Journal of Statistical Software, 34(2), 1–24.

 仕事の都合でざっと目を通した奴。実際に読んだのは上記文献ではなく、その改訂版らしき R のbetaregパッケージのvignetteである。ちょっと都合があって、betaregを実戦投入しようかと思ったことがあったので。
続きを読む

読了:Yeatman & Trintapoli (2011) あなたの友達のセフレの人数を教えてください、あなたのじゃなくて

 少し前に目を通した奴。

Yeatman, S., Trintapoli, J. (2011) Best-friend reports: A tool for measuring the prevalence of sensitive behaviors. American Journal of Public Health, 101(9), 1666-1667.

 偏見とか薬物使用のようなセンシティブな事柄についての調査で、調査対象者自身について訊いてもどうせ答えてくれないだろうから、対象者の友達を思い浮かべてもらって訊いちゃう、というのはときどき見かけるやり方だと思うんだけど、先日友人から先行研究を問われて答えに詰まり、ネットを探して見つけた奴。たった2頁だけど、掲載誌からしてそんなに変な内容ではないだろうと。
続きを読む

読了:大隅, 鳰(2012) 総調査誤差とはなにか

読んだものはなんでも記録しておこうということで… しばらく前に目を通したもの。

大隅昇, 鳰真紀子 (2012) 「総調査誤差」をめぐって : ロバート M.グローヴス、ラース ライバーグ論文「総調査誤差-過去、現在、未来-」を中心に. 日本世論調査協会報「よろん」, 110, 18-31.
続きを読む

読了:Liu & Chen (2015) k件法項目の回答分布を2群で比べる検定はMann-Whitney検定とKolmogorof-Smirnov検定とCramer-von Mises検定のどれがいいか

Liu, Z., Chen, H. (2015) Power analysis for testing two independent groups of likert-type data. 5th International Conference on Computer Sciences and Automation Engineering (ICCSAE 2015).

 リッカート型のデータの分布が2標本の間で同じかどうか調べる場面で、Mann-Whitney検定(MW), Kolmogorof-Smirnov検定(KS), Cramer-von Mises検定(CM)の頑健性と検定力を比較する、という内容。
 どこかの学会の発表要旨なんだけど… 内容がいま知りたいこととジャストミートだったので、ついつい読んでしまった…
続きを読む

読了:Dufor & Farhat (2002) 2群の分布が等しいかどうかの正確ノンパラ・モンテカルロ検定

Dufor, J.M., Farhat, A. (2002) Exact Nonparametric Two-Sample Homogeneity Tests. In: Huber-Carol C., Balakrishnan N., Nikulin M.S., Mesbah M. (eds) Goodness-of-Fit Tests and Model Validity. Chap.33.

 仕事の都合でがんばって読んだ奴。2標本Kolmogov-Smirnov検定が、離散変数のときにどうなるのかを知りたくて、なにか書いてあるかなあと思ったのである。
続きを読む

読了:Heck (2018) ネストされたモデル間のベイズファクターなら、いつだってSavege-Dickey密度比で求められるぜ、なんて思うなよ

Heck, D. W. (2018) A caveat on the Savage–Dickey density ratio: The case of computing Bayes factors for regression parameters. British J. Mathematical and Statistical Psychology.

 仕事の都合で読んだノンパラ検定のベイズ・ファクターについての論文(van Doorn, et al. 2020) で、ネストされたモデルのベイズファクターを点密度だけで簡単に求めるというくだりが出てきて (Savege-Dickey 密度比)、よくわからんかったので探して読んでみた。
 論文の主旨は、Savege-Dickey 密度比を使ってはいけない場面があるよ、特に回帰係数の検定のときには気をつけなさい、というもの。
続きを読む

読了: van Doorn, Ly, Marsman, Wagenmakers (2020) 順位和検定・符号順位検定・順位相関の検定をベイズ・ファクターでやる方法

van Doorn, J., Ly, A., Marsman, M., Wagenmakers, E.J. (2020) Bayesian rank-based hypothesis testing for the rank sum test, the signed rank test and Spearman’s rho. Journal of Applied Statistics.

仕事の都合で慌てて読んだ奴。順位和検定、符号順位検定、順位相関の検定をベイズ・ファクターでやるにはどうすればよいかという解説論文。

続きを読む

読了:Janssens & Martens (2020) ROC曲線下面積に対するご批判にお応えしよう

Janssens, A.C.J.W, Martens, F.K (2020) Reflection on modern methods: Revising the area under the ROC curve. International Journal of Epidemiology, 1-7.

 ちょっと都合で読んだ奴。今年出た記事で、タイトルの通り、ROC曲線下面積(AUC)についての解説。
 題名に添えて Education Corner と書いてあるから、この雑誌にはそういう啓蒙コーナーがあるのだろう。American StatisticianのTeacher’s Cornerみたいなもんかな。
続きを読む

読了: Christodoulou, et al. (2019) 機械学習による臨床リスク予測はロジスティック回帰より優れているかというと、これがそうでもない

Christodoulou, E., Ma, J., Collins, G.S., Steyerberg, E.W., Verbakel, J.Y., Calster, B.V. (2019) A systematic review shows no performance benefit of machine learning over logistic regression for clinical prediction models. J. Clinical Epidemiology, 110, 12-22.

 仕事の資料をまとめて読んでいる途中でつい読んじゃった奴。タイトル通り、医療分野の予測において機械学習は古典的なロジスティック回帰よか優れているわけではない、というレビュー。はっはっは。
続きを読む

読了: Preston & Colman (2000) X件法評定尺度のXはなにがよいか実験 in 2000

Preston, C.C., Colman,A.M. (2000) Optimal number of response catgories in rating scales: Reliability, validity, discriminating power, and respondent preferences. Acta Psychologica, 104, 1-15.

 仕事の都合でざっと目を通した。「X件法評定尺度のXはどうするのがよいか」実験。あまりに枯れたトピックなので、00年代の論文は珍しい。
続きを読む

読了:Wikman & Warneryd (1990) 再検査信頼性はどんな調査項目で低くなるか

Wikman, A., Warneryd, B. (1990) Measurement errors in survey questions: Explaining response variability. Social Indicators Research, 22, 199-212.

 仕事の都合でばーっと目を通した奴。
 要するに「どんな項目で検査再検査信頼性が低いか」を、実際の公的調査で調べてみました、という話であった。
続きを読む

読了:Felix (2011) 3件法で訊こうが9件法で訊こうがリスケールしちゃえば変わんないよ

Felix, R. (2011) The impact of scale width on responses for multi-item, self-report measures. J. Targeting, Measurement and Analysis for Marketing, 19, 153-164.

 仕事の都合でリッカート尺度の段階数について調べてたら、なんと2011年の研究が出てきて、びっくりして目を通した。この話題でまだ論文書く人がいるの!? という驚きだが(検索でひっかかる論文はたいてい80年代まで)、まああれかもね、盛り上がることも滅びることもなく総括も進展もない、ゴルフの打ちっ放しみたいな感じのテーマなのかもしれないっすね。
 著者はメキシコのマーケティングの先生。途中で疑問に思って調べたけど(失礼な…)、ちゃんとした業績のある方であった。掲載誌についてはよくわからない。CiNiiによれば現在はJ. Marketing Analyticsという誌名らしい(寡聞にして初耳である)。大学図書館での所蔵館数は1。渋い。
続きを読む

読了: Breugelmans et al. (2015) これからのロイヤリティ・プログラム研究はかくあるべし

Breugelmans, E., et al. (2015) Advancing research on loyalty programs: A future research agenda. Marketing Letters, 26, 127-139.

少し前に仕事の都合で読んだ奴。ロイヤリティ・プログラムについての概観論文。9人の連名で、ワークショップのまとめなのだそうで、そういうのは総花的でつまんないことが多いんだけど、まあ短いからいいかと思って。
続きを読む

読了:Acemoglu, et al. (2020) コロナ禍の下でのロックダウン政策をマルチリスクSIRモデルに基づき最適化する(お年寄りだけ厳しくロックダウンするのがよい)

Acemoglu, D., Chernozhukov, V, Werning, I., Whinston, M.D. (2020) A Multi-risk SIR model with optimally targeted lockdown. Working Paper 27012, National Bureau of Economic Research.

 なんかいろいろ考えちゃったら眠れなくなり、仕方がないので明け方まで、SNSでみかけた仕事と関係ない論文を読んでいた。NBER(全米経済研究所)のワーキングペーパーで、日付はMay 2020になっているから、著者の誰かが「書いたぜ」と宣伝したのが拡散したのであろう。
 Multi-Risk SIRモデルというから、感染症の数理モデルの古典であるSIRモデルに、生存時間分析でいうところの競合リスクをいれるのかな? 新型コロナと経済自殺が競合するとか? と思ったんだけど(暗い発想だ)、そうではなくて、一言でいうとリスクと接触性に異質性をいれるという話だった。先日読んだ西浦・稲葉(2006)にmultitype epidemicモデルという言葉が出てきたけど、これもそのひとつかしらん?
 さらに、モデルを当てはめるだけでなくて政策的介入(ロックダウン)の最適解を求めるぜという主旨。なるほど、経済学者だろうしね…と思って著者の名前をよくみたら、筆頭のアセモグルって前に読んだ「国家はなぜ衰退するのか」の著者だ。たぶん有名な経済学者だと思う。へー。
続きを読む

読了:Liao (2005) 時系列クラスタリング法レビュー

Liao, T.W. (2005) Clustering of time series data: A survey. Pattern Recognition, 38, 1857-1874.

 ほんとは年明けからロイヤリティ・プログラム関連の文献を集めていて、さっさと読みはじめなきゃと思ってたんだけど、パンデミックで世界が激変するなか、そうした話題がなんだかすべて虚ろに思えてきてしまい、当面の仕事とは無関係な本や論文ばかりを読んでいた。
 これもそのひとつで、しばらく前にめくった奴。当座の仕事とはあんまり関係ないんだけど、でもこういうのはいつ突然必要になるかわからないから、前もって勉強しておかなきゃ、などと自分に言い訳しながら適当にぱらぱらと目を通した。一種の逃避である。データ解析の仕事だっていつまで続けられるのかわからないのにね… 人の営みとは哀しいものだ。
続きを読む