ゼミナールゲーム理論入門 読者からの質問と回答
読者からの質問のうち、誤植に関しては訂正情報と正誤表に、演習問題に関する質問は演習問題の補足説明に載せています。
ここではそれ以外のものに対して載せています。
第6章 6.4.2について
質問:6.4.2マキシミニ戦略とミニマックス値を求める というところでわからなくなってしまいました。 マキシミニ戦略の求め方の1つ目2つ目は何とかわかるのですが3つ目がわかりません。
- 「図6.24のグラフより最悪の利得を与えるプレイヤー2の(純粋)戦略は、X2とY2の両方である(p211)」→最悪の利得とはなんですか?グラフの交点の場所だとしたらそこがなぜ最悪なのですか?
- 「プレイヤー2の期待利得は、プレイヤー1がX1を選んでもY1を選んでも等しいはずである。(p211〜212)」→なぜですか?
質問1の回答:
- 最悪の利得とは、最小の利得のことです。図6.23と図6.24には、プレイヤー2がx2を選んだときとy2を選んだときの
プレイヤー1の期待利得が分かります。これを見ると...
- 0≦x<3/4では、プレイヤー2がx2を選ぶときがプレイヤー1にとって利得は最小 (最悪)となる。
- 3/4<x≦1では、プレイヤー2がy2を選ぶときがプレイヤー1にとって利得は最小 (最悪)となる。
- そして、 x=3/4では、プレイヤー2がx2を選ぶときとy2を選ぶときの両方が、プレイヤー1 にとって利得は最小(最悪)となる。
- したがって「プレイヤー1のマキシミニ戦略x=3/4」に対して、利得を最小に する戦略はx2とy2の両方である
- このようにプレイヤー2の戦略が2つだと、プレイヤー1
のマキシミニ戦略x=3/4に対して最小(最悪)の利得を与える戦略が「すべての」
戦略であり、言っている意味が分かりにくいのですが、プレイヤー2の戦略が3つ
あると意味が分かってきます。P212のプレイヤー2の戦略が3つの場合を見
てみましょう。
- 0≦x<1/3では、プレイヤー2がy2を選ぶときがプレイヤー1にとって利得は最小 (最悪)となる。
- x=1/3では、プレイヤー2がx2を選ぶときとy2を選ぶときの両方が、プレイヤー1 にとって利得は最小(最悪)となる。(z2では最悪にはならない)
- 1/3<x<2/3では、プレイヤー2がx2を選ぶときがプレイヤー1にとって利得は最小 (最悪)となる。
- x=2/3では、プレイヤー2がx2を選ぶときとz2を選ぶときの両方が、プレイヤー1 にとって利得は最小(最悪)となる。(y2では最悪にはならない)
- 2/3<x≦1では、プレイヤー2がz2を選ぶときがプレイヤー1にとって利得は最小
(最悪)となる。
- したがって「プレイヤー1のマキシミニ戦略x=2/3」に対して、利得を最小にする戦略はx2とz2の両方です。(y2ではない)、となります。このように マキシミニ戦略に対して、相手のどの戦略が利得を最悪にするかは相手の戦略 が3つ以上あるときに重要になります。
- なお「最小」ではなく「最悪」と言っている理由は、ゼロ和ゲームでプレイヤー 1の利得表だけを使った場合、プレイヤー1では利得を最小にすることが最悪です が、プレイヤー2は(プレイヤー1の利得を)最大にすることが最悪で、「最小」 と言ってしまうと、同じ原理をプレイヤー2にとって当てはめたときに分からなく なってしまうからです。
質問2の回答
- .ミニマックス定理では「プレイヤー2のマキニミニ戦略に対して最悪の利得を 与える戦略は、プレイヤー1のマキシミニ戦略」だということが分かります。 またプレイヤー1のマキシミニ戦略はp=3/4であることが既に求められています。
- .もしプレイヤー2のマキニミニ戦略における期待利得が、x1よりy1の方が大き
いと、プレイヤー2のマキシミニ戦略に対して最悪の利得を与える戦略はx1に
なります。したがってミニマックス定理より、プレイヤー1のマキシミニ戦略
はx1(p=1)となり、p=3/4であることに矛盾します。 - 同様にプレイヤー2のマキニミニ戦略における期待利得が、y1よりx1の方が大
きいと、プレイヤー2のマキシミニ戦略に対して最悪の利得を与える戦略はy1に
なります。したがってプレイヤー1のマキシミニ戦略はy1(p=0)となり、p=3/4
であることに矛盾します。 - したがってプレイヤー2のマキニミニ戦略における期待利得は、x1とy1で
等しくなければなりません。
- だいたいは上記の通りですが、実は2についてはもう少し詳しい説明が必要
カも知れません。プレイヤー1の混合戦略をx1をp,y1を1-pで選ぶようなもの
として考えると、このような戦略に対するプレイヤー2の期待利得は
p×(x1での期待利得)+(1-p)×(y1での期待利得)
になります。もしプレイヤー2のマキニミニ戦略における期待利得が、x1より y1の方が大きいと、プレイヤー2のマキシミニ戦略に対して最悪の利得を与え る戦略はp=1になります。p=3/4での期待利得は、p=1よりも大きくなります。
これは、p=3/4がプレイヤー1のマキシミニ戦略であることに矛盾します。
