ナッシュ均衡と、囚人のジレンマ
更新日:2017/09/18
ゲーム理論では、ゲームの参加者が相談したり協力したりできるゲームと、参加者が相談したり協力したりできないゲームがある。
前者が「共同作戦ゲーム」、後者が「非協力ゲーム」という風に呼ばれている。
以前紹介した囚人のジレンマのゲームは、容疑者同士が連絡できない前提だったので、非協力ゲームだ。
この非協力ゲームを研究したのが、ジョン・フォーブス・ナッシュだ。
そして非協力ゲームでの解の一種を、「ナッシュ均衡」(Nash equilibrium)と呼ぶ。
ナッシュ均衡とは、ゲームに参加しているメンバー全員が、自分の戦略・行動を変更しても、今以上に利益を得られないような均衡点のことを指す。
要するに「それ以上あがいても、得はできない」という状況のことだね。
囚人のジレンマのゲームでは、容疑者が自白する方が、黙秘を続けるよりもリスクが低いため、自白を選ばざるを得ない状態になる。
これがこのゲームにおけるナッシュ均衡点になる。
似たような概念には、パレトー最適・パレトー効率性というのがあった。
パレトー効率性というのは、グループ全体の効用・満足度が最大になる状態のことで、あくまでもこれはグループ全体に着目した話だ。
一方、ナッシュ均衡の場合は、個人がそれぞれ自分の利得から考えた選択をした結果の均衡点になる。
「個々人が、自分の最悪の状態を回避するような選択」をした結果、決まる均衡状態だ。
その結果、ナッシュ均衡は、全体の効用が最大化されるパレトー効率性とは、異なる結果になることが多々ある。
つまり個々人が他人ことを考えつつ、自分の立場から最善の選択をした結果、グループ全体としては、余り良くない均衡点になってしまい、ジレンマが起こる。
ジレンマというのは、どっちを取っても、もう一方がダメになるというトレードオフの状態で、これが囚人のジレンマの「ジレンマ」の部分だ。
純粋戦略ナッシュ均衡
ゲームのプレイヤーが、他のプレイヤーの状態を見て、それに対処することで、自分の利益を増やそうとする。
別のプレイヤーはそれらを見ながら、新しい対処をして自分の利益を増やそうとする。
こういう繰り返しを何回か行って、どこかに落ち着けば、そこがナッシュ均衡になる。
たとえば菓子メーカーAと、別の菓子メーカーBが、似たようなチョコ菓子を発売するとする。
このとき、製造原価は共に50円で、販売経費が20円だったとする。
つまりこの菓子は70円以上で売らなければ利益が出ないことになる。
ここでメーカーAとメーカーBは、販売価格を決める。
選択肢は取りあえず90円か100円とする。
値段が10円も違うと売れる数も変わるので、二つのメーカーの価格とシェアを次のように仮定してみる。
お菓子の価格とシェアの利得表
販売シェア | B社(競合):販売価格90円 | B社(競合):販売価格100円 |
---|---|---|
A社(自社):販売価格90円 | (A社:0.5、B社:0.5) | (0.7、0.3) |
A社(自社):販売価格100円 | (0.3、0.7) | (0.5、0.5) |
上の利得表は、販売価格が同じなら、半分のシェア(0.5)が取れると仮定している。
そして他社より高ければ、0.3のシェアしか取れないと仮定している。
価格を100円に設定すれば、利益は一個あたり30円になるが、競合他社が90円で売り出せば、シェアが0.3しかとれない。
価格を90円にすれば、上手く行けばシェアは0.7取れるが、利益は一個あたり10円減る。
こういう状態で、取るべき戦略(行動)はどうなるかというと、最初は高い値段で販売していたとしても、シェアを増やすために値下げを行うという戦略になる。
その結果、A社もB社も、販売価格を90円に下げざるを得ず、そこがナッシュ均衡となる。
こういう風に、単純にお互いの戦略を見つつ、自社の戦略を決定して、落ち着く場所が決まるのを「純粋戦略ナッシュ均衡」と呼ぶ。