ゼミナールゲーム理論入門 読者からの質問と回答

読者からの質問のうち、誤植に関しては訂正情報と正誤表に、演習問題に関する質問は演習問題の補足説明に載せています。

ここではそれ以外のものに対して載せています。

第6章 6.4.2について

質問:6.4.2マキシミニ戦略とミニマックス値を求める というところでわからなくなってしまいました。 マキシミニ戦略の求め方の1つ目2つ目は何とかわかるのですが3つ目がわかりません。

  1. 「図6.24のグラフより最悪の利得を与えるプレイヤー2の(純粋)戦略は、X2とY2の両方である(p211)」→最悪の利得とはなんですか?グラフの交点の場所だとしたらそこがなぜ最悪なのですか?
  2. 「プレイヤー2の期待利得は、プレイヤー1がX1を選んでもY1を選んでも等しいはずである。(p211〜212)」→なぜですか?

質問1の回答:

  • 最悪の利得とは、最小の利得のことです。図6.23と図6.24には、プレイヤー2がx2を選んだときとy2を選んだときの プレイヤー1の期待利得が分かります。これを見ると...
    • 0≦x<3/4では、プレイヤー2がx2を選ぶときがプレイヤー1にとって利得は最小 (最悪)となる。
    • 3/4<x≦1では、プレイヤー2がy2を選ぶときがプレイヤー1にとって利得は最小 (最悪)となる。
    • そして、 x=3/4では、プレイヤー2がx2を選ぶときとy2を選ぶときの両方が、プレイヤー1 にとって利得は最小(最悪)となる。
    • したがって「プレイヤー1のマキシミニ戦略x=3/4」に対して、利得を最小に する戦略はx2とy2の両方である
    ということになります。
  • このようにプレイヤー2の戦略が2つだと、プレイヤー1 のマキシミニ戦略x=3/4に対して最小(最悪)の利得を与える戦略が「すべての」 戦略であり、言っている意味が分かりにくいのですが、プレイヤー2の戦略が3つ あると意味が分かってきます。P212のプレイヤー2の戦略が3つの場合を見 てみましょう。
    • 0≦x<1/3では、プレイヤー2がy2を選ぶときがプレイヤー1にとって利得は最小 (最悪)となる。
    • x=1/3では、プレイヤー2がx2を選ぶときとy2を選ぶときの両方が、プレイヤー1 にとって利得は最小(最悪)となる。(z2では最悪にはならない)
    • 1/3<x<2/3では、プレイヤー2がx2を選ぶときがプレイヤー1にとって利得は最小 (最悪)となる。
    • x=2/3では、プレイヤー2がx2を選ぶときとz2を選ぶときの両方が、プレイヤー1 にとって利得は最小(最悪)となる。(y2では最悪にはならない)
    • 2/3<x≦1では、プレイヤー2がz2を選ぶときがプレイヤー1にとって利得は最小
      (最悪)となる。
  • したがって「プレイヤー1のマキシミニ戦略x=2/3」に対して、利得を最小にする戦略はx2とz2の両方です。(y2ではない)、となります。このように マキシミニ戦略に対して、相手のどの戦略が利得を最悪にするかは相手の戦略 が3つ以上あるときに重要になります。
  • なお「最小」ではなく「最悪」と言っている理由は、ゼロ和ゲームでプレイヤー 1の利得表だけを使った場合、プレイヤー1では利得を最小にすることが最悪です が、プレイヤー2は(プレイヤー1の利得を)最大にすることが最悪で、「最小」 と言ってしまうと、同じ原理をプレイヤー2にとって当てはめたときに分からなく なってしまうからです。

質問2の回答

  1. .ミニマックス定理では「プレイヤー2のマキニミニ戦略に対して最悪の利得を 与える戦略は、プレイヤー1のマキシミニ戦略」だということが分かります。 またプレイヤー1のマキシミニ戦略はp=3/4であることが既に求められています。
  2. .もしプレイヤー2のマキニミニ戦略における期待利得が、x1よりy1の方が大き いと、プレイヤー2のマキシミニ戦略に対して最悪の利得を与える戦略はx1に なります。したがってミニマックス定理より、プレイヤー1のマキシミニ戦略
    はx1(p=1)となり、p=3/4であることに矛盾します。
  3. 同様にプレイヤー2のマキニミニ戦略における期待利得が、y1よりx1の方が大 きいと、プレイヤー2のマキシミニ戦略に対して最悪の利得を与える戦略はy1に なります。したがってプレイヤー1のマキシミニ戦略はy1(p=0)となり、p=3/4
    であることに矛盾します。
  4. したがってプレイヤー2のマキニミニ戦略における期待利得は、x1とy1で
    等しくなければなりません。
  • だいたいは上記の通りですが、実は2についてはもう少し詳しい説明が必要 カも知れません。プレイヤー1の混合戦略をx1をp,y1を1-pで選ぶようなもの として考えると、このような戦略に対するプレイヤー2の期待利得は
         p×(x1での期待利得)+(1-p)×(y1での期待利得)
    になります。もしプレイヤー2のマキニミニ戦略における期待利得が、x1より y1の方が大きいと、プレイヤー2のマキシミニ戦略に対して最悪の利得を与え る戦略はp=1になります。p=3/4での期待利得は、p=1よりも大きくなります。
    これは、p=3/4がプレイヤー1のマキシミニ戦略であることに矛盾します。