【論文まとめ1】Kajii and Morris (1997) "The Robustness of Equilibria to Incomplete Information" ECMA

キーワード

higher order belief; incomplete information; refinements; robustness.

あらすじ

・(完備情報ゲームにおいて)ナッシュ均衡は分析者から見た起こりうる帰結の予測として理解出来る.しかし,実際には分析者がプレイヤー達の利得環境を的確に把握できていないかもしれない.そのような場合,均衡概念が帰結の予測として機能するためには実際の利得環境が"少し"異なっていても帰結が"大幅には"変わらないという均衡の不完備情報に対する頑健性が必要になる.
・しかしRubinstein (1989)のEメールゲームが示唆するようにたとえ(強)ナッシュ均衡であったとしても,利得環境に対する共有知識の仮定が崩れ,ほんの少しでも"crazy type"の可能性が存在する場合,その最適行動が"感染"しその行動組は均衡として導かれないかもしれない.
*1
*2
・そこで、均衡が不完備情報に対する頑健性を満たすための十分条件を考察するのがこの論文である.
・近しいモチベーションの論文はKajii and Morris (1997)の前にもいくつかあった(らしい)が,元の完備情報ゲームに"近い"不完備情報ゲームという概念と頑健性という概念を(特定のクラスでなく)一般的に定義し,その枠組みで議論をしているという点もこの論文の貢献である.

モデル

完備情報ゲーム

・プレイヤー: N
 i \in Nの行動: A_i(有限集合)
 iの効用関数: g_i: A \to \mathbb{R}
以上が(完備情報)ゲーム Gを定める.
Gの相関均衡 \mu \in \Delta Aとは以下をみたす行動分布である.

定義(相関均衡)

行動分布 \mu \in \Delta Aがゲーム Gの相関均衡であるとは以下が成立ことである.
任意の i \in Nと行動 a_i, a_i'に対して \sum_{a_{-i}}g_i(a_i,a_{-i})\mu(a_i,a_{-i}) \geq \sum_{a_{-i}}g_i(a_i',a_{-i})\mu(a_i,a_{-i}) i.e.  E_{\mu}[g_i(a_i,a_{-i})] \geq E_{\mu}[g_i(a_i',a_{-i})] .*3

不完備情報ゲーム

完備情報ゲーム Gを埋め込む不完備情報ゲームという概念を定義する.
・状態空間: \Omega(可算集合)
・状態の上の確率: P
 iの情報分割: Q_i
 iの(状態依存)効用関数: u_i:A\times\Omega \to \mathbb{R}
 N Aと以上が不完備情報ゲーム Uを定義する.このように定義されたUをGを埋め込む不完備情報ゲームと呼ぶ.
Uにおける iの(混合)戦略 \sigma_iとは Q_i可測な \Omegaから A_iへの写像であり,Uのベイズナッシュ均衡は以下で定義される.

定義(ベイズナッシュ均衡)

戦略組 (\sigma_i)_iベイズナッシュ均衡であるとは以下を満たすことである.
任意の i,  a_i, \omegaに対して \sum_{\omega' \in Q_i(\omega)}u_i(\sigma(\omega'),\omega')P[\omega' \mid Q_i(\omega) ] \geq \sum_{\omega' \in Q_i(\omega)} u_i(a_i,\sigma_{-i}(\omega'),\omega')P[\omega' \mid Q_i(\omega)]

次に戦略組 \sigmaが導く帰結を定義しよう.実現した状態 \omegaは必ずしも分析者が観測できるものではないため,帰結は状態が実現する前の段階から見た事前の行動分布として定義する.

定義(均衡行動分布)

行動分布 \mu \in \Delta AがゲームUの均衡行動分布であるとは,あるベイズナッシュ均衡 \sigmaが存在して \mu(a)=\sum_\omega\sigma(a \mid \omega)P(\omega)が成立することである.

頑健性

まず,不完備情報ゲームUが完備情報ゲームGに近いという概念を定式化しよう.Uにおける利得関数がGと同じものである確率が高ければ高いほどUはGに近いという直観に基づいて議論を行う.
Uにおいて全てのプレイヤーが自分の効用関数はGと同じであると分かっているような状態を \Omega_U=\{\omega \mid u_i(a,\omega')=g_i(a) \mbox{ for all } a\in A, \omega'\inQ(\omega), \mbox{ and } i\}と書くことにする.*4

定義( \varepsilon-elaboration of G)

Uが P(\Omega_U)=1-\varepsilonを満たすとき,これをGの \varepsilon-elaborationと呼ぶ.*5
二つの行動分布 \mu, \nuの距離をmaxノルムで定める.i.e.  \| \mu-\nu \|=\max_a \mid \mu(a)-\nu(a)  \mid .
以上の準備を用いて均衡行動分布の頑健性を定義する.

定義(頑健性)

行動分布 \muが完備情報ゲームGにおいて不完備情報に頑健であるとは以下を満たすことである.
任意の \delta>0に対してある \bar{\varepsilon}が存在し,任意の 0<\varepsilon\leq\bar{\varepsilon}に対してGのすべての \varepsilon-elaborationなるゲームは \| \nu-\mu \|\leq\deltaなる均衡行動分布 \nuを持つ.

頑健でない行動分布は,「ひとたび完備情報でなくなってしまえば,どんなに元のゲームに( \varepsilonelaborationの意味で)近いゲームを考えても行動分布の距離(差)が \delta以下になるような均衡をもたない.」という解釈,すなわちほんの少しでも完備情報が崩れてしまえば復元できなくなるような均衡であるという解釈である.

結果

頑健な行動分布は全てのゲームにおいて存在するとは限らない.実際,唯一のナッシュ均衡が存在するゲームに対してそのナッシュ均衡における行動分布が頑健でないという例は存在する.(セクション3.1)
この論文では均衡行動分布が頑健であるための十分条件が二つ提示されている。
一つ目は,相関均衡がただ一つ存在する場合である.この場合この相関均衡は唯一の頑健な均衡行動分布となる.
二つ目を述べるにあたり,支配戦略均衡とナッシュ均衡の間をsmoothにパラメタライズするような均衡概念, \bf{p}-dominant均衡を定義する.( \bf{p}  =(p_1, \cdots, p_n)\in[0,1]^N)

定義( \bf{p}-dominant均衡)

戦略組 a^\ast \in AがGの \bf{p}-dominant均衡であるとは,任意の i,  a_i,  \lambda(a_{-i}^\ast)\geq p_iなる\lambda \in \Delta A_{-i}に対し, \sum_{a_{-i}}\lambda(a_{-i})g_i(a^\ast_i,a_{-i})\geq \sum_{a_{-i}}\lambda(a_{-i})g_i(a_i,a_{-i})が成立することである.
 \bf{p}=(0,\cdots,0)であれば支配戦略均衡となり, \bf{p} =(1,\cdots,1)であればナッシュ均衡である. \bf{p}が小さくなればなるほどきつい条件となる.
二つ目の十分条件 a^\ast \sum_i p_i<1なる \bf{p}に対し \bf{p}-dominant均衡であるとき a^\astは頑健な行動分布であるというものである.

関連文献

・Rubinstein (1989) : e mail game
・Monderer and Samet (1989): p common belief
・Ui (2001): ポテンシャルゲームにおいてポテンシャル関数を最大化するナッシュ均衡は頑健であることを示した.
・Morris and Ui (2005): 一般化ポテンシャル関数を導入し,Ui (2001)の十分条件とKajii and Morris (1997)の十分条件を統一的に理解できるような一般的な十分条件を与えた.
・Kajii and Morris (2020) : survey

不明点メモ

Critical path theorem の解釈
頑健⇒ナッシュ均衡

*1:Email ゲーム流の"almost common knowledge"の概念は均衡帰結に対して頑健ではないので、頑健となような"almost common knowledge"の概念を提示したのがMonderer and Samet (1989) のp common beliefである.Kajii and Morris (1997)ではこの論文の概念や議論を本質的に用いている.

*2:Section3.1ではたとえ元の完備情報ゲームに唯一(強)ナッシュ均衡が存在したとしてもそれは不完備情報に頑健とは限らないという例を与えている.

*3:ナッシュ均衡は独立な行動分布を導くが,相関均衡は相関した行動分布を許す点に注意されたい.ナッシュ均衡が導く行動分布は相関均衡であるため,相関均衡はナッシュ均衡より弱い概念である.

*4:他のプレイヤーの利得関数がGと同じであると知っているかどうかという高階信念に関する要請は課していない点に注意されたい.

*5:何らかのGの0-elaborationにおける均衡行動分布であることの必要十分条件はGの相関均衡であることである.cf.Aumann(1987) したがって,0-elaborationなるゲーム達はもとのゲームに十分近いと分析者からは見えているかもしれないが,プレイヤーからしてみれば必ずしも近いとは言えない.完備情報ゲームGにおいては利得環境は共有知識になっているが,0-elaborationゲームにおいては他のプレイヤーの利得環境や知識に関する条件はなにも課していない.