読了:Balinski & Laraki (2007) Majority Judgement とはなにか

Balinski, M., Laraki, R (2007) A theory of measuring, electing, and ranking. PNAS, 104(21), 8720-8725.

 研究会で経済学の先生に、majority judgementという社会的決定ルールがあると教えて頂き、俺にもわかるだろうか?と探して読んでみた。たった6頁だけど、けっこうしんどい。
 定理の証明は著者らの近著 “One-Value, One-Vote: Measuring, Electing and Ranking” をみよとのこと。おそらく “Majority judgment: measuring, ranking, and electing“(2011)のことであろう。

 不慣れな分野の論文だからしかたないんだけど、ちょっと細かくメモを取りすぎである…
 小見出しは私が勝手につけている。原文では、社会的決定に関わる成員のことをjudges, votersなどと表現しているが、面倒なので以下のメモでは「判定者」に統一する。またalternatives, candidates, competitorsなどを「選択肢」に統一する。preference(選好)と utility(効用)は1-2章までは同じ意味で使われていると思うが、3章からはややこしくなる。

[イントロ]
 社会的選択理論の主な応用先は投票と陪審決定(jury decision. たとえばフィギュアスケートの審査)である。そこでの基本的な問題は、判定者が示したメッセージを入力、ランキングなり勝者なりを出力とする社会決定関数(SDF)を見つけることである。

 社会的選択理論の多くは、判定者の選好と、彼が示し得るメッセージとの区別をあいまいにしてきた。伝統的モデルでは、それぞれの判定者が選択肢を順序づけすれば、それがその人のメッセージでありかつその人の選好になる。しかし現実世界では、メッセージは判定者の選好に依存はするが、判定者の選好そのものではない。選好は、決定、他の判定者のメッセージ、社会決定関数(民主的な決定を好むとか)、メッセージの望ましさ、などにも依存する。

  • 社会的決定理論についての深い分析を最初に行ったのはアローだった。彼は伝統的なモデルを使っていた。判定者にとっての入力は順序付けであり、それは判定者の選好の完全な表現と解釈されるのがふつうだった(そこには戦略的考慮はない)。判定者にとっての出力は順序付けと勝者であった。彼の有名な不可能性定理は、任意の入力の下で(選択肢が2つの場合を除く)、決定を得る際に合理的だと考えられる3つの特性を同時に満たす社会厚生関数(SWF)が存在しないことを示している。
  • センは、それぞれの判定者にとっての入力が候補の数値的な効用であり、出力が順序付けであるようなモデルを考えた。理論的には興味深いが実務的な意味はあまりないモデルである(判定者の個人効用はもっと複雑な概念だから)。ここでも、効用が比較可能だと仮定しない限り、不可能性定理が出現する。
  • 個々の判定者にとっての入力が真の選好順序、出力が戦略的に選ばれた順序づけであるモデルに基づき、有名なGibbard-Satterthwaiteの不可能性定理が証明された。この定理によれば、すべての判定者にとって真の選好の報告が支配戦略であるような社会的選択関数は存在しない。

 伝統的アプローチからはこうした不可能性定理が山ほど生み出され続けている。我々はここに新しい否定的定理を付け加えたい。伝統的モデルの出力として、勝者と順序付けは基本的に両立不能だ、という定理である。かんたんにいうと、もし判定者にとっての入力が選好で出力が順序付けなら、その入力とは単一の順序付けではなく、順序付けについての選好でなければおかしいんじゃないですか、ということである。
 こう主張したい。

  • アローならびに他の不可能性・両立不能性が示しているのは、伝統的モデルの文脈では解がない、ということである。
  • 伝統的モデルは判定者のメッセージないし目的について適切にモデル化していなかった。
  • 新しいモデルが必要である。

 実践に目を向けてみると、多くの場合、指標・グレードが使われている。フィギュア・スケートの審査の際の評点とか、価格とか。
 指標・グレードというメッセージは効用ではない。判定者は嫌いなワインに高いグレードを与えることもできる。指標が提供するのは共通言語である。それは数値だったり順序尺度だったり言語表現だったりする。アローの定理が意味しているのは、共通言語がない限り、整合的な集団決定はない、ということなのである。[←後述の定理9だと思う]
 メッセージが共通言語で表現されたグレードである時、選択肢を分類し(majority-grade)、順序付けする(majority-ranking)方法を作り出すことができる。この方法は多様な望ましい特性を満たし、判定者の選好に関するさまざまな仮定の下で、判定者の選択的操作に耐える最良の性質を持つ。

1. 伝統的モデル
 選択肢の有限集合\( C = \{A,\ldots,I,\ldots,Z\} \), 判定者の有限集合 \( J = \{1, \ldots, j, \ldots, n\}\)を考える。個々の判定者は入力メッセージを持つ。それは選択肢の順序である。[ここでちょっと戸惑ったんだけど、こここまでで「入力」という言葉は個々の判定者にとっての私秘情報のことを指していたが、ここでは社会決定関数にとっての入力、つまり判定者の表明のことを指しているようだ]
 すべての入力メッセージは選好プロファイルを構成する[←候補を行, 評定者を列にとり、値は選好表明であるような行列のことであろう]。SWFは選好プロファイルを受け取り選択肢の順序を返す。
 ある判定者が\(A\)を\(B\)より上位に順序付けることを\(A \succ B\)とする。SWFが(すなわち社会が)そうすることを\(A \succ_s B\)とする。

[アローの不可能性定理]
 問題の本質的な困難さに最初に気づいたのはコンドルセであった。[全員の選好順序を集約すると循環が生じるという話。メモ省略]
 アローはSWFが満たすべき3条件を挙げた:

  • 全員一致性 (Unamity) : すべての判定者にとって\(A \succ B\)ならば \(A \succ_s B\)
  • 非独裁性 (Non-dictatorship): 他の判定者からの入力がなんであれ、ある判定者からの入力がSWFの出力を決定するということはない
  • 無関係対象からの独立 (IIA): SWFが\( A \succ_s B\)を返すか \(B \succ_s A\)を返すかは、判定者たちの\(A\)と\(B\)の間の選好のみに依存する

 アローが示したのは、少なくとも3つの候補があるとき、ありうるすべての判定者の入力に関して3条件を満たすSWFは存在しないということであった。

[ボルダの方法]
 現実の投票・審査はどうなっているか。
 判定者が選択肢を順序付けし、ある選択肢よりも下にk個の候補を置いたとき、判定者はその選択肢にボルダ点\(k\)を与えた、と考えることができる。ある選択肢が得たボルタ点の判定者を通じた合計をボルダ得点と呼び、ボルダ得点での順序付けをボルダ順序づけ、1位をボルダ勝者という。

 コンドルセはボルダの方法を攻撃した。彼はこう論じた。他のすべての選択肢に対して多数を占める選択肢をコンドルセ勝者と呼ぼう。コンドルセ勝者は必ずしもボルダ勝者でない。
 いま、プロファイルを2つにわけ、それぞれにある方法を適用したら解\(S_1, S_2\)を得られるとして、その方法をプロファイル全体に適用したら解が\(S_1 \cap S_2\)から選ばれるとき、この方法はjoin-consistentだという。たとえば、プロファイルを次の2つにわけたとしよう[数字は判定者の人数]。
 ひとつめ:
  20:\(A \succ B \succ C\)
  28:\(B \succ A \succ C\)
 ふたつめ:
  10:\(A \succ B \succ C\)
  10:\(B \succ C \succ A\)
  10:\(C \succ A \succ B\)
  1:\(A \succ C \succ B\)
  1:\(C \succ B \succ A\)
  1:\(B \succ A \succ C\)
ひとつめの勝者は\(B\)である。ふたつめの1-3行目は完全なシンメトリーになっている(コンドルセcomponentという)。4-6行目も同様。join-consistencyによれば\(B\)が勝者である。この結果は、コンドルセ勝者が存在するとして、それはすべての事例で勝つべき選択肢ではないということである。ボルダの方法はこの難点を逃れている。なぜならコンドルセcompnentにおいてボルダ得点は全候補で等しいからだ。[よくわかんないや… ボルダの方法はjoin consistentだけど、コンドルセ勝者はそうでない、ってこと?]
 Saariはこう述べている。選挙にまつわる全ての困難はコンドルセcomponent(そして選好プロファイルのもっと複雑なシンメトリー)から来ている。ボルダの方法はこうした困難を回避するユニークな順序付けを提供する。
 では、ボルダの方法は順序付けにおいても勝者決定においても優れているのだろうか?

[コンドルセの方法]
 コンドルセは次の順序付け方法を提案した。たとえば\(A \succ_s B \succ_s C \succ_s \ldots \succ_s Z\)という順序付けがあるとしよう。ある判定者がk個のpair-by-pairの比較に合意したら、その判定者はこの順序付けにk点を与えるとする(この点をコンドルセ点という)。すべての判定者を通じたコンドルセ点の合計をコンドルセ・カウントといい、コンドルセ・カウントが最大である順序付けをコンドルセ順序付けという。1位はコンドルセ勝者となる。
 [我ながら頭が悪いなと思うけど、意味がよくわからない。n個の候補のある完全順序付けに私が与えるコンドルセ点とは、順序付けをC(n,2)個のペアの比較にばらしたときそのうち何個の比較に同意できるか、ってこと?]
 コンドルセの方法は、順序付けにおいても勝者決定においても優れているのだろうか?

[勝者決定と順序づけ]
 通常、順序付けと勝者決定はコインの裏表だと考えられている。しかし、勝者を上から順に決めていくのと順序付けは異なる。例を挙げよう。
 333: \(A \succ B \succ C\)
 333: \(B \succ C \succ A\)
 333: \(C \succ A \succ B\)
この選好プロファイルはコンドルセcomponentになっている。A,B,Cはタイである(これにはボルダもコンドルセも同意する)。
 さてここにもうひとりの判定者 \(A \succ C \succ B\)が追加されたとしよう。

  • ボルダなら、Aが勝者、Bが敗者、\(A \succ_s C \succ_s B\)と考える。しかしこの順序付けはばかげている。これに完全に同意している人は1人しかいない。666人は部分的同意、333人は完全に非同意である。
  • コンドルセなら、\(A \succ_s B \succ_C\)と\(C \succ_s A \succ_s B\)がタイだと考える。しかし勝者についてはいえばAとCはタイでない。

このように、ボルダの方法は勝者決定に適切であり、コンドルセの方法は順序付けに適切である。

[incompatibilityの定理]

  • すべての判定者がある選択肢を1位(びり)にしたときにその選択肢が勝者(敗者)になるSWFのことをwinner-loser-unanimousと呼ぼう。
  • すべての判定者がある選択肢を1位(びり)にしているとき、そこにコンドルセcomponentを付け加えてもその選択肢が勝者(敗者)であることをchoice-compatibleと呼ぼう。
  • 選択肢集合から勝者を除外したとき、残りの選択肢の順序がもとの順序と一致することをrank-compatibleと呼ぼう。

 ボルダの方法はchoice-compatibleだがrank-compatibleでない。コンドルセの方法はrank-compatibleだがchoice-compatibleでない。

定理1. incompatibility. winner-loser-unanimous, choice-compatible, rank-compatibleの3つの特性を同時に満たす手法は存在しない。

2. グレーディング: 基礎的モデル
 実務では分類・順序づけに際して得点・指標・グレードが広く使われている。グレードの集合(20点満点とかメダルなし/銅/銀/金とか)はパフォーマンスを評価するための共通言語になっている。
 共通言語\(\Lambda\)はstrictly orderedなグレード\(\alpha, \beta, \ldots\)からなる。有限母集団でも実数のある間隔でもよい。問題はプロファイル\(\Phi = \Phi(C, J)\)で完全に特定される。それは候補数\(m\) × 反転者数\(n\)の行列で、\(\Phi(I,j)\) (\(\in \Lambda\)) は\(j\)さんが\(I\)に対して割り当てたグレードである。

[社会的グレーディング関数]
 グレーディング方法\(F\)は、プロファイルを入力とし、すべての選択肢にプロファイルと同じ共通言語を割り当てる関数である。グレーディング方法は以下の基礎的な特性を満たす必要がある。

  • 公理1. Fは中立である。選択肢の任意のpermutation \(\rho\)について、\(F(\rho \Phi) = \rho F(\Phi)\)。
  • 公理2. Fは匿名である。判定者の任意のpermutation \(\tau\)について、\(F(\Phi \tau) = \rho F(\Phi)\)。
  • 公理3. Fは全員一致的である。もしすべての判定者が選択肢にグレード\(\alpha\)を与えたら、\(F\)はその選択肢にグレード\(\alpha\)を与える。
  • 公理4. Fは単調である。いまプロファイル\(\Phi\)と\(\Phi’\)があり、選択肢\(I\)に対して\(\Phi\)で与えられたグレードと\(\Phi’\)で与えられたグレードを比べると1人以上の判定者において前者のほうがグレードが高いが、その他はすべて同じだとする。このとき、\(F(\Phi)(I) \succeq F(\Phi’)(I)\)である。さらに、もしすべての判定者においてそうであれば、\(F(\Phi)(I) \succ F(\Phi’)(I)\)である。
  • 公理5. FはIIAである。選択肢\(I\)に対して判定者たちが与えたグレードが、プロファイル\(\Phi\)と\(\Phi’\)のどちらにおいても同じなら、\(F(\Phi)(I) = F(\Phi’)(I)\)である。

 実務的観点からは、共通言語は実数の下位集合としてパラメータ化されること、入力がちょっと変われば出力もちょっと変わることが望ましい。従って、共通言語自体は有限でも、共通言語は\([0, R]\)の範囲をとるものとするのが自然である(\(R\)は正の実数)。

  • 公理6. \(F\)と\(f\)は連続的。

 以上6つの公理を満たすグレーディング方法を、社会的グレーディング関数(SGF)と呼ぶ。

[累積関数]
判定者たちのグレードを単一のグレードに変換する関数\(f: \Lambda^n \rightarrow \Lambda\)について考える[プロファイルのある行をスカラーに変える関数ね]。次の3つの特性を満たすとき、これを累積関数 (aggregation function) という。

  • 匿名性 [行のなかの並び順は無視されるってことね]
  • 全員一致性 [全員のグレードが\(\alpha\)なら出力も\(\alpha\)]
  • 単調性 [誰かが与えたグレードが上がった出力は変わらないか上がる、全員のグレードがそれぞれ上がったら出力は上がる]

定理2. possibility. グレーディング方法\(F\)が公理1-5を満たすのは、なんらかの累積関数を\(f\)として、すべての選択肢\(I\) について \(F(\Phi)(I) = f(\Phi(I)) \)であるとき、その時に限る。

 [えーっと、あるグレーディング方法が中立性・匿名性・全員一致性・単調性・IIAを満たすということと、その方法をひとつの選択肢だけについてみたとき匿名性・全員一致性・単調性を満たすということは同値だ、ということね。各選択肢についてそうなんだから中立性とIIAも満たされるってわけか]

3. 順位関数
 ある判定者がSGFを(つまり累積関数を)知っていて、最終的なグレードを操作したいとしよう。
 ある選択肢に対して表明されたグレードを\(r = (r_1, \ldots, r_n)\)とする。判定者たちが正しいと信じているグレードを\(r^{*} = (r^{*}_1, \ldots, r^{*}_n)\)とする。[どういうこと? ある判定者からみて、もし他の人たちがこう信じているならば、ということ?]

[判定者の効用]
 評定者\(j\)の「効用」を\(u_j(r^{*}, r, f, \Lambda)\)とする。それは複雑な関数で、もし彼が正直に答えることを望んでいるならば項\(-|r^{*}_j-r_j|\)がはいるし、もし他の判定者が正直に答えてくれることを望んでいるなら\( \sum_{i \neq j} | r^{*}_i – r_i | \)がはいる。
 [ここでいっている効用とは選択肢への選好のことではなくて、ある事態に対して感じる主観的価値のことだと思う。その事態の構成要素として、ある選択肢への他の人たちの真の選好, 表明された選好、SGF, 出力されたグレード、を考えているわけだ。]

 多くの場合、効用は「単峰」であると仮定される。すなわち\( u_j(r^{*}, r, f, \Lambda) = -|r^{*}_j – f(r_1, \ldots, r_n)|\)。[えーと、俺の真の選好に近いグレードになってほしいということね]

 現実には、判定者の効用も信念も他の人についての信念も未知である。我々が開発する手法は、効用についての明示的な想定がいっさいなく(「メカニズム・デザイン」ではない)、かつ、合理的な「効用」の幅広いクラスに関してstrategy-proofである。

[strategy-proof-in-grading]
 スカラー\(r\)が選択肢の最終的グレードだとしよう。ある判定者の入力グレードが\(r^+ > r\)であるとき、彼の入力をどう変えても最終的グレードはより低くなり、彼の入力グレードが\(r^- < r\)であるとき、彼の入力をどう変えてもより高くなるとき、累積関数は strategy-proof-in-grading であるという。
 [原文: An aggregation function is strategy-proof-in-grading if, when a judge’s input grade is \(r^+ > r\), any change in his input can only lead to a lower grade; and if, when a judge’s input grade is r^- < r, any change in his input, can only lead to a higher grade. わからん。たとえば私のグレードがBで最終的グレードがDのとき、私のグレードをAに変えてもCに変えても最終的グレードはDより低くなる、ってこと? ええええ?]

 [2022/08/16追記: 山本(2012)による解説をメモしておく(表記は私にわかりやすい形に変えている)。
 いま、判定者たちが付与したグレードのベクトル \(r = (r_1, \ldots, r_j, \ldots, r_n)\)があるとする。\(j\)さんが\(r_j\)を\(r’_j\)に差し替えたとして、差し替えた後のベクトルを\(r’\)とする。
 累積関数\(f\)が判定者\(j\)によって戦略的に操作されるとは、以下のいずれかを指す。

  • \(r_j \succ f(r)\)かつ \(f(r’) \succ f(r)\)となる\(r’_j\)が存在するとき。つまり、\(j\)がもともとも付与していたグレードが最終的グレードより高く、かつ\(j\)が自分が付与したグレードを差し替えることで最終的グレードが高くなりうるとき。
  • \(r_j \prec f(r)\)かつ \(f(r’) \prec f(r)\)となる\(r’_j\)が存在するとき。つまり、\(j\)がもともとも付与していたグレードが最終的グレードより低く、かつ\(j\)が自分が付与したグレードを差し替えることで最終的グレードが低くなりうるとき。

 … なるほど、そういう定義ならよくわかる。理解できてほっとしたんだけど、それはそれで新しい疑問が。

  • \(r_j \prec f(r)\)かつ \(f(r’) \succ f(r)\)となる\(r’_j\)が存在するとき。つまり、\(j\)がもともとも付与していたグレードが最終的グレードより低く、かつ\(j\)が自分が付与したグレードを差し替えることで最終的グレードが高くなりうるとき。

は、戦略的操作可能だとはいわないのだろうか? 戦略的操作ってことは、自分の表明を操作することで、社会的決定をその人にとっての選好に沿って変化させることができる、ということですよね。\(r_j\)がその人の選好を表している、ってなぜいえるんだろうか?]

 strategy-proof-in-gradingであるということは、最終的グレードが正しいグレードから離れていればいるほど判定者がそれを好まないならば、判定者にとって自分が正しいと信じているグレードを正直に割り当てるのが支配戦略であるということを意味する。

[順位関数]
 strategy-proofであるSGFのクラスが存在する。すなわち順位関数 order function である。
 \(k\)番目に高いグレードを\(k\)位関数 \(f^k\)という。

定理3. 唯一の strategy-proof-in-grading SGF は順位関数である。

 [何の説明もないので戸惑ったが、order functionとは、グレードのベクトルをうけとり、そのなかの上から\(k\)番目のグレードを返す関数のことであろう。中央値もorder functionのひとつである。
 ううむ、それにしてもよくわからん。SGFを順位関数とするということは、たとえばそれが2位関数なら、「判定者たちが付与したグレードのうち2番目に高い値を採用する」ってことだよね? 仮に1番目のグレードがB, 2番目のグレードがC、よって最終的グレードはCだとしよう。Bを付与してた判定者のちひとりがグレードをAに変えたら、最終的グレードはBにかわるじゃん? これってstrategy-proof-in-gradingじゃないんじゃない? 私はどうやらなにかを理解できていないようだ…]

 [2022/08/16追記: 山本(2012)に、順位関数が戦略的操作不可能であることの証明が載っていたので、メモしておく。
 \(k\)位関数について考える。入力ベクトルの要素の添字をつけ直して、\(r_1 \succeq r_2 \succeq \ldots \succeq r_n\)とする。関数の出力は\(r_k\)となる。
 \(r_j \succ r_k\)と仮定する。いま、\(j\)が\(r_j\)を\(r’\)に差し替えたとしよう。

  • 差し替え後の値が \(r’ \succeq r_k\)であれば、関数の出力は\( r_k \)のまま。
  • 差し替え後の値が \(r’ \prec r_k\)であれば、関数の出力は\( r_l \)か \(r’\)になる。

いずれの場合も\(r_k\)より高くない。 \(r_j \prec r_k\)の場合も同様。証明終わり。
 あー、なるほど。戦略的操作というのは、自分のグレードを差し替えて、最終的グレードを自分のもとのグレードの方向に動かすことだから、順位関数は操作できないことになるのか。富裕層がさらに儲けても世帯年収中央値は変わんないというのと同じね]

[操作可能性]
 評定者の効用がもっと複雑なとき、戦略的操作はどんな効果を持つか? 操作のためには、自分のグレードを上げ下げすることで最終的グレードを上げ下げできないといけない。

定理4. グレードのすべてのプロファイルについてすべての判定者が最終グレードを上げることも下げることもできないようなSGFは存在しない。最終グレードを上げ下げできる判定者がせいぜいひとりしかいないような唯一のSGFは順序関数である。

 累積関数を\(f\), 入力グレードを\(r = (r_1, \ldots, r_n)\)とする。最終グレードを上げられる判定者数を\(\mu^- (f, r)\), 下げられる判定者数を\(\mu^+ (f, r)\), その和を\(\mu (f, r)\)とする。
 \(f\)の操作可能性を次のように定義する。$$ \mu(f) = \mathrm{max}_{r} \mu(f, r) $$ 操作可能性は最悪で\(2n\)である。たとばボルダの方法だと、\(f\)はグレードの算術平均で、その操作可能性は\(2n\)である。いっぽう、\(f\)が\(k\)位順序関数ならその操作可能性は\(n + 1\)である。 

定理5. 操作可能性を最小限にする唯一のSGFは順序関数である。

[reinforcing]
 判定者がグレードを付与しおえたあとで、何人かの判定者が自分のグレードが最終的グレードに近くなるようにグレードを修正したとき、最終的グレードが変わらないことを、\(f\)はreinforcingであるという。

定理6. reinforcingである唯一のSGFは順序関数である。

[conform]
 もしすべての判定者が、ある下位集合に含まれるグレードを割り当てれば、最終グレードはその下位集合に含まれるべきである。これを、\(f\)は付与されたグレードをconformするという。

定理7. 付与されたグレードをconformする唯一のSGFは順序関数である。

[言語一致性と選好一致性]
 グレーディングに用いられた具体的な言語は、究極的なアウトカムに影響してはいけない。ある言語を他の言語に誠実に翻訳したなら、累積関数は等しいグレードを返すべきである。陪審意思決定の文脈ではこれを測定理論の「有意味性」問題という。この性質を[形式的に書いてあるけど省略]、言語一致性という。

定理8. 言語一致性のある唯一のSGFは順序関数である。

 この結果は判定者が共通の言語を用いていることに依存する。共通の言語がない場合、ある判定者の入力として意味があるのはグレードの順番だけである。選好一致性とは…[形式的な定義が書いてあるけど省略]

 定理9. アローの不可能性 選好一致性のあるSGFは存在しない。
 この定理が示しているのは、有意味な最終的グレードに達するためには判定者が共通言語を共有していなければならないということである。

4. Majority-Grade

[中央値関数]

定理10. 判定者の多数が\(r\)を付与したとき、最終的グレードが\(r\)となる唯一の累積関数は、中央値関数である。

 [こおから中央値区間という言葉が出てくるけど、値の個数が偶数であるときに値がひとつに決まらないことがあるので区間と呼んでいるだけである。奇数ならひとつに決まるがやはり区間と呼ぶ]

[crankinessに対する抵抗と有効操作性確率]
 \(r_1 \geq \ldots \geq r_n\)で、\(n \geq 3\)で、\(r_1\)と\(r_n\)を除外しても最終的グレードが変わらないとき、そのSGFはcrankinessに抗するという[変人に負けないというような意味らしい]。
 判定者からみて、最終的グレードが自分の理想のグレードから離れていればいるほど嫌いであるとき、支配戦略は自分の理想のグレードを付与することなのだが、それ以外のインセンティブを持つこともありうる。k位順序関数では、\(n-k+1\)人の判定者が最終的グレードを上げることができ、\(k\)人の判定者が最終的グレードを下げることができる。判定者が最終的グレードを上げたいと思う確率を\(\lambda\)、下げたいと思う確率を\(1-\lambda\)として、累積関数の有効操作性確率を以下のように定義する: $$ EM(f) = \mathrm{max}_{r} \mathrm{max}_{0 \geq \lambda \geq 1} \frac{1}{n} (\lambda \mu^+ (f, r) + (1-\lambda) \mu^- (f, r)) $$

定理11. \(EM(f)\)を最小化するかcrankinessに抗する唯一の累積関数は、中央値区間のみに依存する中央値関数である。

[厚生の最大化]
 多くの物理的指標は、間隔が同じなら意味も同じという特性を持っている(いわゆる間隔尺度)。
 たとえば、判定者の不満足を表す距離関数\(d\)が存在するとしよう。ある判定者が付与したグレードが\(r\), 最終的グレードが\(s\)なら、不効用は\(d(r, s) \geq 0\)だとする。[…中略…]
 最終的グレードが全判定者の不効用の合計を最小化するとき、SGFは厚生を最大化するという。

定理12. 厚生を最大化する唯一の累積関数は中央値関数である。

[majority-grade]
 majority-grade \(f^{maj}\)を、\(n\)が奇数なら中央値関数、偶数なら中央値区間の下側を返す順序関数と定義する。

 Aに与えられたすべてのグレードがBのグレードの中央値区間に属しているとき、Aの最終グレードがBの最終グレードよりも高くなることを、SGFは合意に報酬を与えるという。 

定理13. 合意に報酬を与える唯一の中央値累積関数は\(f^{maj}\)である。

5. Majority-Ranking
[strategy-proof-in-ranking]
 定理1で示したように、伝統的モデルでは勝者決定と順位付けは本来的に整合しない。しかしグレーディングの文脈では、グレードの高さの順が順序づけである。
 いっぽう、たとえばスポーツや選挙のように、1位からビリまでの完全な順序が必要になることもある。グレーディングではなくて順序づけが目的である場合、判定者の戦略行動も変わるかもしれない。
 いま任意の判定者\(j\)について、その人のグレードは\(r^A_j > r^B_j\), 最終的グレードは\(r^A < r^B\)だとしよう。この判定者が\(B\)の最終的グレードを下げることも\(A\)の最終的グレードを上げることもできないとき、SGFはstrategy-proof-in-rankingであるという。どっちかしかできないことを部分的にstrategy-proof-in-rankingだという。

定理14. strategy-proof-in-rankigなSGFは存在しない。唯一の部分的にstrategy-proof-in-rankigなSGFは順序関数である。

[majority-ranking]
 majority-ranking (\(\succ_{maj}\)) を以下のように定義する。

  • もし\(f^{maj}(A) > f^{maj}(B)\)ならば \(A \succ_{maj} B\)
  • もし\(f^{maj}(A) = f^{maj}(B)\)ならば, the majority-grade is dropped from the grades of each of the competitors, and the procedure is repeated.

 [ふたつめがよくわからん。たとえば両方の選択肢のmajority-gradeがPだったら、各選択肢に対してPを付与した判定者を除外して、あらためてその2つについてmajority-gradeを求め直す、ということだろうか]

 [2022/08/16追記: 山本(2012)を読んでようやく理解できた。いっちゃなんだが上の説明だけでは理解できるわけがないという気がしますね。
 山本による説明をレシピ風にメモしておく。記号は私がわかる形に勝手に書き換えている。

  • 入力ベクトル \(r\)を\(r_1\)にコピーします。そのmajority grade \(\tilde{r}_1 = f^{maj}(r_1)\)を求めます。
  • ベクトル\(r_1\)から、\(\tilde{r}_1\)に使われた要素を消します。たとえば\(\tilde{r}_1\)が73だったら、ベクトルのなかに含まれている73をひとつだけ消すのです(みんな消すのではありません)。消した後のベクトルを\(r_2\)とし、そのmajority grade \(\tilde{r}_2 = f^{maj}(r_2)\)を求めます。
  • というのを繰り返していくと、majority gradeのベクトル\(\tilde{r} = (\tilde{r}_1, \ldots, \tilde{r}_n)\)が手に入ります。このベクトルをmajority valueといいます。

ああ、なるほど。こうやって作ったベクトルは、選択肢間で比べるとどこかで差がつくでしょうね、もとの入力ベクトルがソート後同一でもないかぎり。
 なお、このやりかただと\(n\)が大きいときに面倒なので、簡略版として、次の\((p, \alpha, q)\)を用いて順序づけるという方法も提案されているそうだ。$$ p = |\{j | r_j > f^{maj}(r)\}| / n $$ $$ q = |\{j | r_j < f^{maj}(r)\}| / n $$ で、\(p > q\)だったら\(\alpha\)は \(f^{maj}(r)\)の後ろに「+」をつけて書き、そうでなかったら「-」をつけて書く。要は、\(f^{maj}(r)\)の右にいる人数と左にいる人数を比べるってことね。これだと完全な順位付けはできないと思うけど。]

定理15. majority-rankingは常にある選択肢を他の選択肢の前に置く。ただし、判定者によって両方が同一のグレード集合を付与されている場合を除く。

[majority-value]
 ある選択肢の第1 majority-gradeを、判定者全体のmajority gradeとし、第2 majority-gradeを、第1 majority-gradeをdroppしたあとに残ったグレードのmajority gradeとする。こうして第n majority-gradeまで求め、これらのベクトルをその選択肢のmajority-valueと呼ぶ。

定理16. Aのmajority-valueがBのそれよりも辞書的に高い時、そのときに限り\(A \succ_{maj} B\)である。

[社会的順序づけ関数が満たすべき特性]
 選択肢A, Bに対してグレード\(r^A = (r^A_1, \ldots, r^A_n), r^B = (r^B_1, \ldots, r^B_n)\)が付与されたとして、ここからA, Bをランク付けすることを考えよう。AよりBが上なら\(A \succ_s B\), AがB以上なら \(A \succeq_s B\)をする。\(n \geq 3\)のとき、\(r\)のなかで最上位のグレードと最下位のグレードをresudial grades, 残りのグレードをcenter gradesと呼ぶ。
 社会的順序づけ関数(SRF)は以下の特性を満たすべきである。

  • 単調性。もし\(A \succeq_s B\)で、ある判定者がAのグレードを上げたら、\(A \succ_s B\)になる。
  • center gradesに関する決定性。AとBの順序づけは、ランキングがタイでない限りcenter gradeによって決まり、タイだったらresidual gradesによって決まる。
  • 合意に報酬を出すこと。

定理17.majority rankingは、単調性、center gradesに関する決定性, 合意に報酬を出す、の3つを同時に満たす唯一のSRFである。

6. 適用例

陪審決定
 2006年のボルドーでのワインコンテストで、1247銘柄のワインが出場し、判定者60人が5人ずつ組になってテイスティングした。14属性について7件法ないし9件法評定。
 14属性の合計点で金賞・銀賞・銅賞を決めたんだけど、これはあまりよくない。属性ごとに優れたワインが優れたワインとはいえないし、審査員は実はどのワインに賞をやろうかを考えて、逆算して点をつけているからだ。
 審査員としては、「あなたにとってのこのワインは{Excellent, Very good, Good, Average, Mediocre}のどれですか」と聞かれたほうが答えやすい。そこでmajority-gradeを使ったら、ワインを正しく識別し、伝統的なやりかたより良さそうだったそうである。[どう良さそうだったのかは書いてない]

投票
 承認投票(投票者が各候補者について「承認する」「しない」のどちらかを選ぶ)はmajority-rankingの特殊例である。2002年フランス大統領選に際して、16人の候補にたいする承認投票の検証が行われた。

共通言語
 先行事例はすでにたくさんある。実験をやって定義するのが望ましい。グレードは偶数個がよいだろう。
—–
 いやー、難しかった… 一行一行にはそれほど難しいことは書いてないんだけど、3章の定理3, 順序関数がstrategy-proof-in-gradingだというところが全く理解できなかった。
 そのせいもあって、そのあとの話の流れにあまりついていけてない。これ、ひょっとしたら著書を読んだ方がわかりやすいのかもしれない。

 majority judgementとは、もちろん社会的決定の話なんだけど、調査の文脈にあてはめればこういう話だと思う(自信がないけど…)。
 n人の調査対象者にm個のモノについてk件法評定を求めた。

  • m個のモノへの評価を対象ごとに集計したい。そこで、各モノに対する長さnの反応ベクトルの中央値をとる(偶数だったら中央値の下の値をとる)。
  • m個のモノにタイのない順序を与えたい。その際は、集団レベル評価の順序を用いる。タイについては、各モノについてそのモノにそのタイの値を付与した対象者をひとり取り除いて集計し直し、改めて順序をつける。

 うううううむ… この方法、どういうメリットがあるんでしょうね。社会的決定の文脈で、定理1から17で示されたメリットがあることはわかるんだけど、調査の文脈に置き換えるとそれらがなにを意味しているのか、まだぴんときていない。
 結局、大きなメリットは耐戦略性なのかなあ? 調査の文脈では、誘因整合的な調査手法(正直申告がその人にとっての報酬を最大化するような手法)に対するニーズはすごく高いと思うんだけど、集計値を自分の選好に近づけたいという戦略的行動に対する耐性には、あまりニーズがないような気がする。集計値がフィードバックされることは比較的レアだし。
 耐戦略性のほかにメリットはないのだろうか。単にk件法の反応を1点からk点に置き換えて平均するより、この手法のほうが気が利いてそうだという気がするんだけど。