next up previous contents
Next: 戦略の支配 Up: 戦略形ゲーム Previous: ミニマックス原理

ナッシュ均衡

定義 (最適応答 best response)
プレイヤー $i$ の戦略 $i \in S_{i}$ が他の $n-1$ 人のプレイヤーの戦略の組
\begin{displaymath}
s_{-i} = (s_{i},\cdots,s_{i-1},s_{i+1},\cdots,s_{n})
\end{displaymath} (6.8)

に対して、
\begin{displaymath}
f_{i}(s_{i},s_{-i})=max_{t \in S_{i}}f_{i}(t_{i},s{-i})
\end{displaymath} (6.9)

であるとき最適応答(best response)であるという.

定義 (ナッシュ均衡)
標準型ゲーム $G = (N, S, u)$$N$ はプレーヤーの集合,$S$は戦略の集合,$u$ は利得の集合)において,戦略の組 $s^{*} \in S$がナッシュ均衡であるとは,全てのプレイヤー$i \in N$ と全ての $s_{i} \in S_{i}$において,
\begin{displaymath}
u_{i} \ge u_{i}(s_{i},s^{*}_{-i})
\end{displaymath} (6.10)

を満たすことを指す。但し,$s_{-i}$$i$以外のプレイヤーの戦略の組を指す。

すなわち、ナッシュ均衡とは,ゲーム理論の最も基本となる均衡概念で、ゲームに参加するすべてのプレーヤーが相互に他者の戦略を考慮に入れつつ、自己の利益を最大化するような戦略を実行したときに成立する均衡状態のことを意味する。
多数のプレーヤーが参加する非協力ゲームでは、あるプレーヤーがどのように戦略を変えても、自分以外のプレーヤーが戦略を変えない限り、それ以上には結果がよくならない混合戦略の組み合わせ(均衡点)が少なくとも1つ存在する。この均衡点では各プレーヤーが相互に最適戦略を取り合っている状況となり、すべてのプレーヤーが自分だけ戦略を変えても得にならないため、戦略の変更がない安定状態となる。
また、ナッシュ均衡はすべてのゲームに1つ以上あるが、1つしかないとは限らない。
更に、ナッシュ均衡はその状況における最適ではあっても、各プレーヤーにとって必ずしも最善な戦略、すなわち最大利得を保証するものではない。その典型例が「囚人のジレンマ」である。 ナッシュ均衡は、19世紀に活躍したフランスの数学者・経済学者のアントワーヌ・A・クールノー(Antoine Augustin Cournot)が論じた、複占市場における均衡状態(クールノー均衡)をn人に拡張したものといえる(クルーノー均衡は、クールノ=ナッシュ均衡とも呼ばれる)。また、ゲーム理論的にはゼロサム2人ゲームの均衡定理であるミニマックス定理の一般化となっている。

定理 (ゼロ和2人ゲームの鞍点 saddle point)
ゼロ和2人ゲームにおいて戦略の組である $s^{*}=(s_{1}^{*},s_{2}^{*})$ がナッシュ均衡であるための必要十分条件は、全ての $s_{1} \in S_{1},s_{2} \in S_{2}$ に対して、
\begin{displaymath}
f(s_{1},s_{2}^{*}) \leq f(s_{1}^{*},s_{2}^{*}) \leq f(s_{1}^{*},s_{2})
\end{displaymath} (6.11)

が成立することである.
$s^{*}=(s_{1}^{*},s_{2}^{*})$ をゼロ和2人ゲームの鞍点(saddle point)という.

まず、

\begin{displaymath}
f(s_{1},s_{2}^{*}) \leq f(s_{1}^{*},s_{2}^{*}) \leq f(s_{1}^{*},s_{2})
\end{displaymath} (6.12)

が成立しているとすると、
\begin{displaymath}
max_{1} f(s_{1},s_{2}^{*}) = f(s_{1}^{*},s_{2}^{*}) = min_{2} f(s_{1}^{*},s_{2})
\end{displaymath} (6.13)

である.また、常に、
\begin{displaymath}
min_{2} max_{1} f(s_{1},s_{2}) \leq max_{1} f(s_{1},s_{2}^{*})
\end{displaymath} (6.14)

および、
\begin{displaymath}
min_{2} max_{1} f(s_{1}^{*},s_{2}) \leq max_{1} min_{2} f(s_{1},s_{2})
\end{displaymath} (6.15)

であるから、以上を合わせると、
\begin{displaymath}
min_{2} max_{1} f(s_{1},s_{2}) \leq f(s_{1}^{*},s_{2}^{*}) \leq max_{1} min_{2} f(s_{1},s_{2})
\end{displaymath} (6.16)

ところで、一般的には、
\begin{displaymath}
max_{1} min_{2} f(s_{1},s_{2}) \leq min_{2} max_{1} f(s_{1},s_{2})
\end{displaymath} (6.17)

であるから、
\begin{displaymath}
max_{1} min_{2} f(s_{1},s_{2}) = f(s_{1}^{*},s_{2}^{*}) = min_{2} max_{1} f(s_{1},s_{2})
\end{displaymath} (6.18)

が成立する.


next up previous contents
Next: 戦略の支配 Up: 戦略形ゲーム Previous: ミニマックス原理
digistats.net
平成23年5月2日