読了: Quinn & Bederson (2011) ヒューマン・コンピュテーションを分類する

Quinn, A.J., & Bederson, B.B. (2011) Human Computation: A Survey and Taxonomy of a Growing Field. CHI’11: Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. 1403-1412.

ヒューマン・コンピュテーションについてのレビュー。誰かと話していてうっかりヒューマン・コンピュテーションという言葉を使ってしまい、自分もよく意味がわかっていないな… と思って読んだ奴。google様によれば被引用回数1182なんだけど、この分野では13年前の国際会議発表なんて古文書に近いでしょうね…

1.イントロダクション
 […研究小史…]
 本論文はヒューマン・コンピュテーション[長いので以下HCと略記する]・システムの分類体系を提案する。

2. HCの定義
 HCという語は、哲学・心理学ではWayland(1838)”The Limitations of Human Responsibility”に出てくる[Francis Wayland, 神学者。福沢諭吉「学問のすすめ」の種本とされる本を書いた人だそうな]。
 最近の用法は2005年ごろから出てきた。いろんな定義を見比べると、以下の点が共通している。(1)HCが扱う問題は、計算という一般的パラダイムに合致したもので、よっていつの日か計算機によって解かれうるようなものである。(2)計算システムないし計算プロセスによって人間の参加が采配される。

3. 関連するアイデアとの比較
[オンライン掲示板やWikipediaはHCでないという話。メモ省略]

  • クラウド・ソーシング。2006年のWiredの記事にはじまる言葉。伝統的な労働者を大衆成員に置き換える。HCと一部重なる。たとえばMonoTransプロジェクトという翻訳のプロジェクトとか。
  • ソーシャル・コンピューティング。技術に媒介されているが比較的に自然な人間行動を促進しようとする。HCと一部重なる。
  • データ・マイニング。データからパターンを抽出する個別具体的なアルゴリズムの適用のことで、HCとは重ならない。
  • 集合知。伝統的には、大集団の固有の意思決定能力に焦点を当てている[Levy(1997), Mataric(1993 Chap.)というのをreferしている。前者は”Collective Intelligence”という本で、邦訳はなさそう]。いっぽう広くとれば、人間の集団が集合的に行っていることが知的にみえることを指すので、クラウド・ソーシングやソーシャル・コンピューティングを包含する。でもHCとは重なるだけで包含はしない。集合知というのはプロセスが参加者に依存しているときを指すからだ。

[ポンチ絵が載っている。えーと、ソーシャル・コンピューティングとクラウド・ソーシングがあって、一部重なっている。これらを含むもっと大きな集合として集合知がある。で、HCはソーシャル・コンピューティングともクラウド・ソーシングともその重複部分とも重なり、よって集合知とも重なるが、集合知には包含されない]

4. 分類軸
[めんどくさくなってきたので、本文はきちんと読んでいないけど…]

  1. モチベーション
    • pay. Machanical Turkとか。
    • 利他主義。Jum Grayという人が海で遭難して、ボランティアが膨大な衛星写真を集めて探したことがある。
    • 楽しみ。いわゆるGWAPs (games with a purpose)。
    • 名声。Internatilan Children’s Digital Libraryの翻訳の仕組みとか。
    • Implicit work. reCAPTCHAで人間にOCRさせるとか。
  2. 品質コントロール [この要因、水準が多すぎませんか。もうちょっと抽象化できそうなものだ]
    • 出力一致。ESP Gameとか。
    • 入力一致。Tag-a-Tune gameというのがあって、プレイヤーはそれぞれある音声ファイルを聞いて記述する。で、お互いの記述が同じ音声ファイルについての記述だと判断したらその記述がOKになる。[??? これ出力一致とどうちがうの?]
    • economic model. Gentry et al.(2005, Conf.)では、ワーカーのレイティングのゲーム理論的モデルに従って報酬金額を支払い、チートを減らしている。
    • defensive task design. チートするよりしないほうが楽なように課題を設計する。
    • 冗長性。reCAPTCHAとか。
    • 統計的フィルタリング。期待分布に合わない結果は割り引く。
    • マルチレベル・レビュー。Soylentというワープロサービスとか。
    • 自動的チェック。解くのは難しいけど検証は簡単という問題もある。
    • reputation system. Mechanical Turkとか。
    • (本文には載っていてまとめの表にはない首位順として、expert review, ground truth seedingがある)
  3. 累積
    • collection.
    • wisdom of crowds. [本文ではデータの統計処理という見出しになっている…]
    • search. みんなであるものを探す.
    • 反復的改善. Little, et al.(2010 Conf.)というのがあって、Machanical Turkでワーカーを変えて繰り返していくというのを提案している。
    • 遺伝的アルゴリズム. Kosorukoff (2001 Conf)というのがある。[おもしろそう。調べてみたら、すでにWikipediaに項目ができているぞ]
    • なし。単にたくさんの小さな課題をそれぞれの参加者が独立にやって終わり、というやつ。
  4. 人間のスキル
    • 視覚的認知
    • 言語理解
    • 基本的コミュニケーション. ChaChaという、検索の注文を受け取ってうまく解釈して検索結果を返すというサービスがある。
  5. 処理の順序 [これは本質的な分類軸なの? と一瞬疑問に思ったけど、工学的な観点からはそうかもね]
    • コンピュータ→ワーカー→リクエスター
    • ワーカー→リクエスター→コンピュータ
    • コンピュータ→ワーカー→リクエスター→コンピュータ
    • リクエスター→ワーカー
  6. task-request cardinality
    • one-to-one
    • many-to-many
    • many-to-one
    • few-to-one

5. 今後の課題

  • 新しい軸ペアを探す。2つの軸をとってきてそのすべての組み合わせを考えてみよう。
  • 軸の新しい値を探す。たとえばプロテインのfoldingのゲームは人間の空間操作能力を使っているけど、それってHCではあまり使われていない。
  • 新しい適用例が出てきたらそれを分類してそのバリエーションについて考える。

6. 結論
[略]