elsur.jpn.org >

« 読了:11/30 (F) | メイン | 読了:12/04まで (NF) »

2005年11月30日 (水)

 勤め先の会社で,調査データをどう分析するかという相談をしていたら,相手がふとこんなことを云った。データを調べる前に,あらかじめ「見たいもの」を決めてしまうようなやり方は嫌なんです。なんだかそれって予定調和だという感じがする。
 そうつぶやいた若い女性は,データ解析に関してはほぼnoviceだといってよい。しかし,(会社の先輩に対して大変失礼な言い方だが) とても勘の良い人で,明確で筋道だった問題意識を持っている人だった。
 どんな話の流れの中でそんな言葉がでてきたのか,よく思い出せない。その時は特に強い印象を受けず,なにか適当な受け答えで済ませてしまったような気がする。ずっとあとになって,あの言葉は俺に対する間接的な批判ではなかったか,と考えるようになった。正確にいえば,それは意図的な批判ではない。そのときの文脈やそのあとのやりとりから考えても,その人自身は俺に対して反論する意図を全く持っていなかったし,その言葉も深い意味合いをこめたものではなかったと思う。しかし俺にしてみると,その人に対して俺が繰り返し強調していたことについて,その問題点を一言で言い当てられたような,首筋にそっとナイフを当てられたような気がしたのだった。

 俺がその人に主張していたのはこういうことだ。ここにデータ行列があるから,それを虚心に眺め,なにか面白い事柄をみつけよう --- こういう発見的な方略は,魅力的ではあるけれども,勝算がほとんどない。まず「なにが見たいのか」を決めましょう。どんなナイーブな思いつきでもいい,分析に際しての視点を定めましょう。
 俺の考え方は決して間違っていないと思う。何の予断も持っていないように思えても,実はデータを手にした段階で,我々は現象を捉えるなんらかの枠組みを持っているものだ。我々はその枠組みに沿って問いを立て,その枠組みに沿って結果を解釈する。だから,その枠組みを顕在化・明確化することがまず必要だし,それによって「見たいもの」は自ずから定まるはずだ。強い言い方をすれば,分析に際して「見たいもの」がはっきりしないというのは,当該の現象そのものについてよほど関心がないか,でなければ物事をきちんと考えていないということだと思う。
 さらにいえば,実際の分析手順としてみても,ある程度までは仮説検証的なアプローチを採るのが現実的だ。データ行列が含んでいる情報はあまりに豊かであり,データをインタラクティブに視覚化して仮説探索していく作業は,仮説検証的な分析よりもはるかに高いスキルを必要とする。要するに,仮説を探すよりも検討する作業のほうがラクなのだ。考えてみればそれは当たり前の話で,仮説検証と仮説探索のちがいは,現象を抽象化するというしんどい作業をあらかじめ済ましておくかどうかというちがいでもある。
 でもその一方で,あらかじめ視点を限定すればするほど,そこから得られる知見は痩せていく。現象駆動的な問題意識からスタートしている場合,確たる理論的背景がないこと自体は悪いことではないし,そのときデータとの対話の中で自分の分析枠組みを明確化していこうとするのはひとつの見識だし,そうすることによってしか得られないタイプの視点もあるはずだ。俺はそういう要素をできるだけ減らして,コストと納期を見積もりやすい分析へと向かおうとしていたわけだが,それが一種の出来レースだという批判は,なるほど一面の真実である。

 というのは,ずいぶん奇麗な言い方だ。
 要するに怖いのです。データと際限なく格闘する泥沼に突き進むのが。答えがないかもしれない問いに巻き込まれるのが。容赦なく時間だけが経ち,はっきりするのは自分の無能さだけ,そういう恐怖をあなたは知っていますか(誰に向かって訴えているんだかわからんが)。真実なんてどうだっていい,平和が欲しい,幸せになりたい。そういうお年頃なのです。

雑記:データ解析 - 予定調和

rebuilt: 2020年4月20日 19:05
validate this page