論文:データ解析」カテゴリーアーカイブ

読了: 万, et al. (2020) 比例ハザード性を仮定しない生存時間Bump Hunting手法の提案

万可, 谷岡健資, 南弘征, 下川敏雄, 水田正弘 (2020) 治療効果が顕著なサブグループを抽出するための境界内平均生存時間に基づく生存時間Bump Hunting法の開発. 計算統計学, 33(1), 1-28.

 仕事の都合でめくった奴。
 どういう話かというと、観察データなり臨床試験のデータなりから、新治療と既存治療のアウトカムの差が特に大きいサブグループを抽出したいという話である。大変失礼ながら提案手法そのものには関心がなくて、この領域にはどういう手法があるのかな、という関心から斜め読みした次第。すいません、ちゃんと読んでないです…
続きを読む

読了: Rue, Martino, Chopin (2009) INLAを使って楽しい楽しい潜在ガウシアン・モデル (前編)

 流れ流れてデータ解析とかで生計を立てていますが、一日に三回くらい、なぜ私はこんなことをしているのか… もっとましな人生があったのではないか… という疑念に囚われる。もっとましな人生ってなに? よくわかんないけど。
 さらに、Stanのコンパイルでイライラするたび、なぜ私はこんな面倒なことをしているのか… これはMCMCじゃなくてなにか別の方法でも解けるのではないか… という疑念に囚われる。別の方法ってなに? 知らんけど。INLAとか?
 そんなこんなで、数年前から何度かINLAを実戦投入しようとし、その度に挫折している。検索すると2017年、R-INLAについての解説を読んでいるようだが、メモを読み返すと内容をあまり理解できていないことが丸分かりである。切ないのう。

Rue, H., Martino, s., Chopin, N. (2009) Approximate Bayesian Inference for Latent Gaussian Models by Using Integrated Nested Laplace Approximations. Journal of Royal Statistical Society, B. 71(2), 319-392.

 そういうわけで、先日も仕事の都合で発作的にINLAの勉強をはじめた(仕事のほうは時間切れでそれどころではなくなり、結局はStanで切り抜けた)。その際のメモ。長くなるので2パートくらいにわける。
続きを読む

読了: Tierney & Kadane (1986) 事後分布の平均とか分散とか周辺密度とかをラプラス近似で得る

Tierney, L, Kadane, J.B. (1986) Accurate Approximations for Posterior Moments and Marginal Densities. Journal of the American Statistical Association, 82(393), 82-86.

 都合により調べ物をしていて(後日のためにメモしておくとRue, Martino, & Chopin(2009), INLAについての論文)、途中で話についていけなくなったので、引用を遡って読んでみた奴。
 こんなの読むなんて柄じゃないんですけどね。数学できないんですけどね。いったいどういう罰ゲームなのか。
続きを読む

読了:合崎(2015) Rのsupport.CEsパッケージとsurvival::clogit()で選択型コンジョイント分析

合崎英男(2015) Rパッケージsupport.CEsとsurvivalを利用した離散選択実験の実施手順. 北海道大学農經論叢, 70, 1-16.

 離散型コンジョイント分析のRパッケージSupport.CEsの作者ご自身による解説。このたび離散型コンジョイント分析の実験計画についてのメモを作っていて、その都合で目を通した。
 Aizaki(2012 JSS), Aizaki, Nakatani, Sato(2014 書籍)の日本語解説版とのこと。ほんとは本を読むべきなんだけど。
続きを読む

読了: 合崎・西村 (2007) 選択型コンジョイント分析の実験計画作成とパラメータ推定

合崎英男・西村和志 (2007) データ解析環境Rによる選択型コンジョイント分析入門. 農村工学研究所技報, 206, 151-173,

 選択型コンジョイント分析の実験計画作成・パラメータ推定についての手順解説。前に目を通していたのだけれど、このたび仕事の都合で選択型コンジョイント分析の実験計画作成について考えていて、メモを書いたりしていた関係で、ついでに再読した。
 第1著者の先生はこの後、選択型コンジョイント分析のRパッケージsupport.CEを公開し、日本語・英語で数多くの解説を書いておられるので、こんなに古いのを読むのは良くないのかもしれないけれど…
続きを読む

読了: Davis, et al. (2021) カウント時系列モデリング・レビュー

Davis, R., Fokianos, K., Holan, S.H., Joe, H., Livsey, J., Lund, R. ,Pipiras, V. Ravishanker, N. (2021) Count Time Series: A Methodological Review. Journal of the American Statistical Association, 116(535), 1533-1547.

仕事の都合でカウント時系列について考えることになり、とりあえずRのtscountパッケージの解説に目を通したら、知らない話題がたくさんあることに気が付き、あわてて手に取った。
続きを読む

読了: Liboschik, Fokianos, Fried (2017) カウント時系列の一般化線形モデル(tscountパッケージ)

Liboschik, T, Fokianos, K, Fried, R. (2017) tscount: An R Package for Analysis of Count Time Series Following Generalized Linear Models. Journal of Statistical Software, 82(5), 1–51.

 カウント時系列データ分析のRパッケージtscountの解説。このパッケージを実践投入する予定はないんだけど、カウント時系列の分析方法について知りたくて手に取った。
 本文だけで34ページある…
続きを読む

読了: Ly, et al.(2017) 頻度主義・ベイジアン・MDLからみたフィッシャー情報量

Ly, A., Marsman, M., Verhagen, J., Grasman, R.P.P.P, Wagenmakers, E.J. (2017) A Tutorial on Fisher information. Journal of Mathematical Psychology, 80, 40-55.

 仕事の都合で選択課題の最適実験計画について調べていて、学力不足を痛感して読んでみた論文。題名のとおり、フィッシャー情報量だけに焦点をしぼったチュートリアルである。
 著者にWagenmakersさんが入っているから、頻度主義だけでなくベイジアンな話が出てくるのは予想がつくが、その2つに並ぶもう一つのパラダイムとしてMDLが出てくるところが、へええ? という感じである。
続きを読む

読了: Glickman & Jensen (2005) 一対比較の適応的実験計画 by ベイジアン最適計画アプローチ

Glickman, M.E., Jensen, S.T., (2005) Adaptive paired comparison design. Journal of Statistical Planning and Inference, 127, 279-293.

 仕事の都合で一対比較法の実験計画の動的最適化について考えていて(なぜこんな柄にもないことを考えているのか…)、タイトルがそのものずばりだったのでめくってみた。Google様いわく被引用件数73件。この分野では多いのだろうか、少ないのだろうか。

 本論文はあいにくトーナメント戦の設計を考えていて(大相撲の15日間の各日の取り組み表を決めるというような状況)、私が抱えているところの、調査における刺激の心理量の一対比較測定という問題とは、いっけん乖離が著しいのだが、でも本質的には同じ話なんだろうなと思う。
続きを読む

読了: Geyer (2011) MCMC入門 (前編)

 仕事の都合でMCMCについて考えていて、マルコフ連鎖が目標分布に収束する理由がやっぱりわかんなくなってしまった。説明を読んだときには「よし理解した」と思うんだけど、いざちょっと応用的な問題になると、実は本当はよく理解できていないということに否応なしに気づかされるのである。

Gayer, C.J. (2011) Introduction to Markov Chain Monte Carlo. in Brooks, S., et al. (eds) “Handbook of Markov Chain Monte Carlo“, CRC Press.

 諦めてはなるまい、というので、MCMCについての分厚い論文集の最初に載っている解説の章を読んでみた。
 全17節。さあ深呼吸。
続きを読む

読了: Sonner, Aislie, & Otther (2007) コンジョイント分析で属性のWTPを推定したいとき、価格の効用を真面目に推定したほうが良いか、いっそ傾き1に固定しちゃった方が良いか

Sonnier, G., Ainslie, A., Otther, T. (2007) Heterogeneity distributions of willingness-to-pay in choice models. Quantitative Marketing and Economics, 5, 313–331.

 仕事の足しになるかと思って読んだ奴。Googleさんいわく被引用件数223。経済学の論文としては、これって多いほうなんですかね?
 最初なにいってんだかわかんなくなって混乱したんだけど、ここでいっているWTPというのは製品そのものに対する支払意思額のことではなく、価格以外の属性の部分効用の増分を価格に換算した値のことである(たとえば、同じ製品がブランドBじゃなくてAだったらいくら多めに払うか)。
続きを読む

読了: Sisson & Fan (2011) 尤度を使わないMCMC

Sisson, S.A., Fan, Y. (2021) Likelihood-Free MCMC. in Brooks, S., et al.(eds) “Handbook of Markov Chain Monte Carlo,”, CRC Press.

 尤度フリーMCMCについての解説。いま仕事の関係で悩んでいることについて、ちょっとした手がかりでも得られるかも、と思って目を通した。高い本を買っちゃったから無理にでもモトを取らなくちゃ、というのがもう一つの動機である。
続きを読む

読了: Chib & Greenberg (1995) Metropolis-Hastingsアルゴリズム解説

Chib, S., Greenberg, E. (1995) Understanding the Metropolis-Hastings Algorithm. American Statistician, 327-335.

 MCMCの古典的手法であるMetropolis-Hastingsアルゴリズムについての解説。Hitchcock(2003) によれば、この手法の普及させる立役者となった論文なのだそうだ。
 現在では日本語でも優れた解説が山のようにあるのに、いまになってこれを読んでいるのは無駄なような気もするんだけど… なんとなく目を通してしまった。
続きを読む

読了: Hitchcock (2003) MCMCの歴史

Hitchcock, D.B. (2003) A History of the Metropolis-Hastings Algorithm. American Statistician, 57(4), 254-257.

 仕事の都合で柄にもなくMCMCについて調べているのだけれど、なにしろ数学の知識がないので到底歯が立たない。いったいボレル測度ってなによ!? どれだけ短期間に値上げできるかってことですか!? (それはぼれる速度だ)

 ついつい現実逃避で、こんなのを読んじゃったりして、メモまでとっちゃったりなんかして…
続きを読む

読了:De’ath (2002) 多変量回帰木のご提案

 Rで決定木・回帰木モデルをつくるとき、標準のrpart::rpart()を使ってもいいし、他にもパッケージが山ほどある。なのに、巷の解説をみると、なぜかmvpartパッケージを使って説明していることが多い。すでに公開停止されたパッケージなのに、なぜか今でも広く使われているように思う。なぜだろう? そんなに使いやすいわけでもないんですけど。
続きを読む

読了:Therneau, Atkinson & Mayo Foundation (2022) Rのrpartパッケージによる決定木・回帰木の舞台裏

Therneau, T.M., Atkinson, E.J., Mayo Foundation (2022) An Introduction to Recursive Partitioning Using the RPART Routines. Octover 21, 2022.

 決定木・回帰木を提供するRの標準パッケージrpartのビネット。たまにこのパッケージを使うとき、パラメータの意味を忘れちゃってて混乱するので、このたび目を通した。
続きを読む

読了: Jacomy, et al. (2014) 俺たちが開発したForceAtlas2はネットワーク・グラフをどのように視覚化しているか

Jacomy, M., Venturini, T., Heymann, S., Bastian, M. (2014) ForceAtlas2, a Continuous Graph Layout Algorithm for Handy Network Visualization Designed for the Gephi Software. PLoS One, 9(6), e98679.

 たまに仕事の都合でネットワーク・グラフを描くことがあるんだけど、あれはホントに怖い。ノードの位置やエッジの太さ・色などの非本質的な視覚的要素によって、ユーザが図から受ける印象ががらっと変わってしまう。正直、データの視覚化手法としては危険すぎると思うこともある。
 ノードの位置を決めるアルゴリズムもいろいろあって困ってしまう。適切なアルゴリズムを選ぶのはなかなか難しいし、個々のアルゴリズムについて理解する時間も体力もないけれど、せめてよく使う奴については、中でなにをやっているのかを知っておきたいものだ。
続きを読む

読了:北條・岡田 (2018) アンカリング・ビネットを使って反応スタイルを分類する

北條大樹、岡田謙介(2018) 係留ビネット法による反応スタイルの分類:ヨーロッパの大規模健康調査を例に. 行動計量学, 45(1), 13-25.
 
 anchoring vignetteについての論文。以前ざっと目を通したんだけど、今回仕事の都合で再読。
続きを読む