【高校生向け】囚人のジレンマとフォーク定理をわかりやすく徹底解説!
目次
囚人のジレンマとは?
囚人のジレンマ(Prisoner’s Dilemma)は、ゲーム理論における最も有名な例の一つです。 これは「自分の利益を最大化しようとすると、かえって全体として損をする」状況を示すモデルです。
ゲーム理論の基本
ゲーム理論とは、複数のプレイヤーが互いに影響を与えながら意思決定を行う状況を数理的に分析する学問です。 プレイヤー(参加者)、戦略(選択肢)、利得(得られる結果)の3つが基本構成要素です。
囚人のジレンマの具体例
有名な例を紹介します。2人の容疑者AとBが逮捕され、別々の部屋で取り調べを受けます。 検察は次のような提案をします:
- もしAとBの両方が黙秘すれば(協力)、軽い罪で1年ずつ服役。
- どちらか一方だけが自白すれば、自白した方は釈放され、黙秘した方は10年の刑。
- 両方とも自白すれば、5年ずつの刑。
この状況を利得行列で表すと次のようになります:
Aが行、Bが列とし、それぞれの数字は(Aの年数, Bの年数)です。
| B: 黙秘 | B: 自白 | |
|---|---|---|
| A: 黙秘 | (-1, -1) | (-10, 0) |
| A: 自白 | (0, -10) | (-5, -5) |
ここで重要なのは、自分の刑期を減らしたいという個人の合理的判断からは「自白」が優位になります。 しかし結果的に両者が自白して、互いに損をしてしまうのです。これがジレンマです。
ナッシュ均衡とは?
ナッシュ均衡とは、すべてのプレイヤーが他人の戦略を所与としたときに、自分の戦略を変えても利得が増えない状況です。
囚人のジレンマでは、両者が「自白」を選ぶことがナッシュ均衡になります。 なぜなら、相手が自白する前提では、自分が黙秘しても得にならないからです。
フォーク定理とは?
フォーク定理(Folk Theorem)は、囚人のジレンマのようなゲームが「繰り返し行われる」場合に、協力が可能になることを示す理論です。
一回限りのゲームでは協力が難しいですが、無限に繰り返されるならば、協力しないことへの「報復」が可能になります。
たとえば、次のような戦略が考えられます:
- 最初は協力する。
- 相手が裏切ったら、自分も以後ずっと裏切る(グリムトリガー戦略)。
このように「未来に報復されるかもしれない」と考えることで、現在の裏切りが割に合わなくなります。
繰り返しゲームと協力の成立
フォーク定理の数理的な表現の一例は以下の通りです。
割引率を \\( \delta \\) として、プレイヤーが得る利得を \\( u \\)、協力戦略による利得を \\( R \\)、裏切りによる一時的利得を \\( T \\)、裏切り後に続く罰の利得を \\( P \\) としたとき、
協力が維持される条件は:
\\[ R + \delta R + \delta^2 R + \cdots \geq T + \delta P + \delta^2 P + \cdots \\] \\[ \Rightarrow \frac{R}{1 – \delta} \geq T + \frac{\delta P}{1 – \delta} \\]
この不等式が成り立てば、プレイヤーは「協力した方が得」と判断するようになります。
まとめ
- 囚人のジレンマは、「個人の合理性」が「全体の非効率」につながる例です。
- ナッシュ均衡は「誰も戦略を変えない状態」です。
- 繰り返しゲームにおいては、将来の罰があることで協力が可能になります。
- フォーク定理は、一定の条件下で「協力」が均衡となることを保証します。
このように、経済学では人間の行動を数学的にモデル化することで、複雑な現実を理解する手助けができます。