分かりにくいを分かりやすいに

公務員試験、受験勉強、家庭教師、海外について発信するブログです。

Tutoring For EveryOne

Making the world to understand easily
家庭教師向け記事一覧
大学受験対策記事一覧
公務員試験対策記事一覧

【スポンサーリンク】

囚人のジレンマ-公務員試験ミクロ経済学

先輩、こんにちは!この間はゲーム理論とナッシュ均衡について教えていただきありがとうございました!

どういたしまして。ゲーム理論の分野はもう完璧?

えぇと、ゲーム理論自体とナッシュ均衡については何とか理解できるようになったのですが、最近新しく「囚人のジレンマ」というのが授業中出てきて、よく分かりませんでした...。

囚人のジレンマ」か。なんか変な名前で難しそうだよね。でも、考え方はナッシュ均衡と同じだから、今回は「囚人のジレンマ」について勉強していこう!

ナッシュ均衡の求め方は?

まず、ナッシュ均衡の定義は2つあり、一つは「各プレイヤーの戦略の組合せの中で、どのプレイヤーも自分だけが逸脱して自分の行動を変えるインセンティブを持たないもの」です。二つ目の定義としては、「互いに他のプレイヤーの行動を所与としたときに、それに対して最適反応となる各プレイヤーの戦略の組合せ」のことを言います。

図;最適な戦略の求め方

各プレイヤーの行動を戦略と言いますが、どのように戦略を決定していくかと言うと、相手の各戦略を基準として、戦略ごとにどのような戦略が良いのかを検討していきます。例えば、コカ・コーラ社が「日本進出」という戦略をとるとき、ペプシ社は「現状維持」という戦略より「日本進出」という戦略ととった方が利得は大きいため、「現状維持」という戦略をとります。このように各プレイヤーの戦略を検討していきながら「ナッシュ均衡」を求めることができます。詳しくは「ナッシュ均衡と支配戦略とは?」で紹介しているのでそちらを見て頂ければと思います。

 

 

囚人のジレンマとは?

囚人のジレンマ」とは、お互い協力すればお互い高い利得が得られるのに、良くない戦略が取られてしまうことを言います。各プレイヤーの戦略の求め方自体は「ナッシュ均衡」の求め方と同じです。囚人Aと囚人Bという2人が「自白」か「黙秘」という戦略をとることで互いの利得が変化します。ちなみに、「囚人のジレンマ」では利得は懲役年数を表し、年数が低いほど利得は高いとします。

 

図;囚人のジレンマ

まず、囚人Aの戦略を求めるとします。最初に囚人Bが「自白」という戦略をとるとき、囚人Aは「自白」という戦略をとると、懲役年数は6年となります。逆に、「黙秘」という戦略ととると懲役年数は9年となります。そのため、囚人Aは「自白」という戦略をとります。次に、囚人Bが「黙秘」という戦略をとったとき、囚人Aが「自白」という戦略をとると、懲役年数は1年ですが、「黙秘」という戦略をとると懲役年数は4年になります。従って、囚人Aにとっては「自白」という戦略が囚人Bの戦略にかかわらず「支配戦略」となります。

 

次に囚人Bの戦略を求めます。最初に囚人Aが「自白」という戦略をとるとき、囚人Bは「自白」という戦略をとると懲役年数は6年になりますが、「黙秘という戦略をとると懲役年数は9年になります。逆に、囚人Aが「黙秘」という戦略をとったとき、囚人Bは「自白」という戦略をとると懲役年数は1年となり、「黙秘」という戦略をとると懲役年数は4年となります。従って、囚人Bにとっては「自白」という戦略が囚人Aの戦略にかかわらず「支配戦略」となり、(囚人Aの戦略、囚人Bの戦略)=(自白、自白)がナッシュ均衡になります。

f:id:bestkateikyoushi:20191101182405j:plain

囚人のジレンマナッシュ均衡

しかし、他の戦略の組み合わせを見ると、(黙秘、黙秘)=(4,4)という組み合わせの方が両者にとって懲役年数が6年から4年に下がるため、お互いにとって良い結果となります。しかし、囚人の取り調べのように他の囚人との口裏合わせができない状況では、(自白、自白)という組み合わせが選択されてしまうことになります。このように「お互い相手が自白か黙秘かわからなくて情報共有ができない時に、本来よりよい選択肢があったのによくない戦略が取られてしまうことを「囚人のジレンマ」と言います。

 

囚人のジレンマ」は、囚人のケースだけではなく、現実にはライバル企業同士の戦略を考える時とかに当てはめて考えたりすることもできるため、実際の社会の意外と応用範囲もとても広いです。

 

【スポンサーリンク】