タッカーゲーム、囚人のジレンマとは
更新日:2017/09/17
囚人のジレンマ(prisoners' dilemma)とは、タッカーゲームとも呼ばれる。
1950年に数学者のアルバート・タッカーが考案したゲームだ。
ゲームのあらましは、こうだ。
ある事件があり、容疑者二人が捕まった。
容疑者は共謀してその事件に関わったと考えられるが、そこで自白を引き出すために、司法取引を提案した。
司法取引とは、検事が指摘している罪を認めることで、刑を軽くしてもらうという取引だ。
この司法取引の内容は、次のようなモノだ。
囚人のジレンマ 条件
- 2人のウチ1人だけが自白した場合、自白した方は無罪とし、自白しなかった方は懲役10年とする。
- 2人共に自白しない場合は、それぞれ懲役2年とする。
- 2人共に自白した場合は、それぞれ懲役5年とする。
- 刑期が確定するまで、2人は相談することができない。
これを利得表にまとめると、こうなる
囚人のジレンマ 利得表
Bが黙秘 | Bが自白 | |
---|---|---|
Aが黙秘 | (A:懲役2年、B:懲役2年) | (A:懲役10年、B:釈放) |
Aが自白 | (A:釈放、B:懲役10年) | (A:懲役5年、B:懲役5年) |
最悪の状態を避ける選択
囚人のジレンマというゲームでは、個人が自分の利益を優先すると、協力したときよりも全体の利得が低くなる場合があるということを表している。
このゲームでは、2人の容疑者とも黙秘すれば、2人とも懲役2年になる。
2人とも自白していたら、2人とも懲役5年を喰らうことになる。
相手が自白し、自分が黙秘すると、自分は懲役10年だ。
一方、自分が自白したとすると、上手く行けば自分は釈放される可能性があるが、仲間に懲役10年を押しつけることになる。
このゲームのミソは、2人の合計懲役年数で考えると、協力したときのみ懲役の合計は4年だが、それ以外は懲役10年になるというところにある。
このとき、A(自分)は、どういう選択をするだろうか。
囚人のジレンマ 利得表(再掲)
B(仲間)が黙秘 | B(仲間)が自白 | |
---|---|---|
A(自分)が黙秘 | (A:懲役2年、B:懲役2年) ※合計4年、パレトー効率的 |
(A:懲役10年、B:釈放) |
A(自分)が自白 | (A:釈放、B:懲役10年) | (A:懲役5年、B:懲役5年) ※ナッシュ均衡 |
A(自分)の立場に立って考えると、黙秘したときは懲役2年か懲役10年、自白したときは、懲役0年か懲役5年。
期待値で考えると、黙秘をすることで平均懲役6年(2年+10年/2)喰らう。
一方、自分が自白する場合では、平均懲役は2.5年(0年+5年/2)になる。
つまり期待値で考えると、自白を選択する方が賢い選択になる。
また、最悪の懲役10年を避けるという考え方でも、自白は有効だろう。
懲役が0年か10年かであれば、バクチを打つ人が多いというのは、以前も紹介したが、そういう風に行動する可能性が高い(→損失回避性 利小損大はなぜ起こる?)。
これは仲間にとっても同じだから、2人の容疑者は2人とも自白し、懲役5年になるだろう。
2人にとって最も良いパレトー効率的な「懲役2年ずつ」という選択は、為されないことになる。
これは参加しているメンバーが、それぞれ最悪の状態を避けて「よりマシな方を選ぶ」結果の均衡点で、特に「ナッシュ均衡」と呼ばれる。