「ピア予測法」はまさに分散型オラクル用のメカニズムデザインだ

分散型オラクルはスマートコントラクトを汎用化する。
しかし既存の手法では適切な合意が得られない。
ピア予測法はこの課題解決に大きく貢献するだろう。

過去記事にて経済学、特にメカニズムデザインの議論がブロックチェーン周りのインセンティブ設計に有用である旨を指摘しましたが、今回はその具体例として「ピア予測法」(peer prediction method)という呼ばれる研究分野の可能性を分散型オラクルと共に紹介します。

分散型オラクルはスマートコントラクトを汎用化する:

ブロックチェーンの文脈において、「オラクル」とはスマートコントラクトの実行に用いる情報を外部から取得するためのシステムを意味し、現状では予測市場に関連して良く話題になります。

例えば1週間後の天気に関する予測市場を実装する場合「実際1週間後の天気はどうなったのか」という結果に関する情報はブロックチェーン内部には存在しないため、外から持ってくる必要があるわけです。

多くの場合、オラクルはTTP (trusted third party: 信頼出来る第三者機関) が提供する情報を正しいものとして直接使用する (e.g., 気象庁のデータを予測市場の結果とみなす) 中央集権型ですが、最近ではAugurなど入力情報の妥当性に関してネットワーク全体で合意形成を試みる分散型オラクルの提案もいくつか成されています。

もしこれが実現すると、スマートコントラクトがTTPに依存せずに扱える情報の範囲が大幅に拡がるため、分散型オラクルには重要な意義があるのです。

*予測市場に限らず、ブロックチェーン外にある情報の入力という点で、土地や美術品などの資産をブロックチェーンを用いて管理するといった事例においても「入力情報は正しいのか？」というオラクルの問題は避けて通ることが出来ないでしょう。TTPに依存しない点がブロックチェーンを採用したシステムの革新性である以上、この手のプロジェクトでは今後必ずオラクル問題が表面化すると予想しています。

しかし既存の手法では適切な合意が得られない:

一方で、分散型オラクル用のインセンティブ設計は未だ十分に議論されておらず、実用に足るアプリケーションが動いているとは言い難い現状です。

既存手法に関しては主な予測市場プロジェクトのホワイトペーパー(e.g., Augur, Gnosis, Stox)で論じられていますが、専ら共通して

検証者達は選択肢 (e.g., 「晴れ」「曇り」「雨」) の中から自身が支持する対象へトークンをstake (賭け)する
選択肢の中で最多のstake量を集めている状態を一定期間維持したもの1つを合意結果と見なし (front runner methodと呼ばれる)、それにstakeしていた検証者達の間で他の選択肢にstakeされていた全トークンを分配する

という勝者総取り型の賭けに近い設計を採用しています。

要するにstakeしたトークンが失われるリスクを通じて検証者達に信念の正直な報告を促そうとしているわけですが、これには

典型的な「美人投票」となり、検証者は自身の選好では無く自身が予想する他者の平均的な選好に基づいてstakeを行ってしまう
多くのトークンを持つ検証者にとって、少数派の選択肢にstakeして合意結果を覆した方が獲得する報酬が大きくなる
ゼロ和ゲームなので、そもそも検証作業に参加するインセンティブがあるとは言えない

など少なくとも3つの問題点が存在しており、その有用性はかなり疑問です。

ピア予測法はこの課題解決に大きく貢献するだろう:

では、客観的な正解が存在しない問題に対して検証者達に信念の正直な報告を促すことは可能なのでしょうか？

ピア予測法 (peer prediction method) はまさにこの課題に挑戦するメカニズムデザインの一種です。

*テクニカルな内容なのでブログで全体をカバーすることは出来ず、よって詳細は初めて手法を提案したMiller et al.(2005)及びその解説スライドなどを参照して下さい。

これはproper scoring rulesと呼ばれる、確率的な事象に対して自身が思う確率を正直に申告した場合に最大のスコアを割り振る手法を応用しています。

このルールだけでも十分面白いのですが、proper scoring rulesは後に事象が客観的な結果として明らかになる (e.g., 気象庁が天気の答えを示してくれる) ことが前提となっているため、正解が無い問題へ単純に適用することは出来ません。

そこでMiller et al.(2005)はモデルにいくつかの仮定を置いた上で、検証者の報告では無く検証者の報告によって更新される (同じ対象を確認している) 他の検証者の報告に関する事後確率分布へのスコアリングを提案し、既存のproper scoring rulesを他者との比較に基づくゲームへと拡張しました。

直感的に言えば、検証者達それぞれが「自分のスコアは自分の報告が他者の報告に与える影響次第で決まる」という前提を共有した上で相手の出方を読み合う限り、彼らは全員正直な信念を報告し得ると考えたのです。(凄い)

ピア予測法は、発表当時はレストラン等に対するレビューサイトやレピュテーションシステムへの利用が想定されていたようですが、自分はこれが分散型オラクルが現在直面する課題に対して極めて有効であると感じています。

例えば入力情報の検証を担当した者達に報酬トークンを新規発行する一方でその量がピア予測法に従って重み付けされるなど、stakeに基づく既存手法を代替する様々なインセンティブ設計が考えられるでしょう。

おわりに:

車輪の再発明はどの分野にもある話ですが、ブロックチェーン周辺のインセンティブ設計に関する議論は既にメカニズムデザインで相当行われていることを改めて痛感しています。

実際分散型オラクルの問題に関しても「流石に客観的な正解が無い問題を扱える魔法みたいな報酬メカニズムなんて無いだろう」と思いつつ調べてみたら、(驚くべきことに) ちゃんとありました。

Miller et al.(2005)以降のピア予測法は、検証達が共謀したり、検証に必要なコストを忌避して適当に回答する可能性などを考慮する形でより実用的に発展している様子なので、まだまだ掘り下げる価値がありそうです。

*本テーマについては、もう少し詳細に書いた論文が秋に発表される予定です。公開の折には、再度ブログでもその旨を告知する予定です。