ゲーム理論とは何か。囚人のジレンマなどを簡単に解説。

チェス 経済学

ゲーム理論って言葉は聞いたことはあるけど、実際にそれがどういう理論なのかわからない。

でも詳しい解説は難しくて見る気が失せる、、

そんな人のためにゲーム理論について凄く簡単に解説します。

スポンサーリンク

ゲーム理論とは

ゲーム理論を簡単に言うと「ゲームに参加しているプレイヤーが、お互いの心理を読んで、どう判断してどう行動するのかを分析する理論」です。

ここでいうゲームとは経済やスポーツ、ビジネスなど、あらゆる戦略的状況を指します。プレイヤーはその戦略的状況に参加している主体の事です。

「あいつはああするはず、そいつはそうするはず。なら俺はこうしよう」

ゲーム理論はこの思考を数学的に分析しています。

有名な例として囚人のジレンマがよく挙げられるので、ここで紹介しておきます。

囚人のジレンマ

証拠は足りないが、共謀犯と思われる2人の囚人ABが、別々の部屋で検事から司法取引を持ちかけられた。

検事はAに言う。

「君が罪を自白してくれるなら君の罪は問わない。無罪放免としよう。代わりにBは懲役10年になるがね」

「この話はBにも伝えているのか?」

「ああ、向こうの部屋で別の検事が同じ話をしている。もし君たち2人が自白を選んだら、2人とも懲役5年。逆に2人とも黙秘を選んだら、証拠不十分として懲役はそれぞれ2年だ。さあ、自白と黙秘、どちらを選ぶ?」

「…………Bと少し話をさせてくれないか?」

「それは許可できない。今この場で決めてくれ」

(俺が自白してBが黙秘したら俺は無罪。でも、Bを裏切る事になる。Bだけが懲役10年。このまま2人で黙秘すれば互いに2年で済む。うん、これしかない。俺は黙秘を選ぶ。…………でも、もし、Bが裏切ったら?)

自白と黙秘。果たしてAはどちらを選ぶのでしょうか?

f:id:chiaki-hagisaka:20210420212500j:image

互いの懲役を見れば分かる通り、両者が黙秘すれば2年ずつで、合計の懲役は最も短くなります。

ですが、2人はこの選択肢を選べるでしょうか?

まずAの目線で状況を考えてみましょう。

もしBが自白を選んだ場合、Aはどうするのが最適ですか?

自分も自白すれば5年。黙秘すれば10年。なら自白をするのが最適な行動ですよね。

次にBが黙秘を選んだ場合、Aの最適な行動は?

自白すれば無罪。黙秘すれば2年。つまり自白が最適な行動になります。

Bが自白しても黙秘してもAにとっての最適な戦略は自白ということになります。

同様にBの目線に立って考えれば、Bにとっても自白が最適な戦略となります。

2人が最善策を選んだ場合、結果は両者自白で懲役5年ずつとなります。

f:id:chiaki-hagisaka:20210420212942j:image

しかしどうでしょう。互いに最適な行動をしたはずなのに、合計は10年。一番良い選択肢を選べていません。

この矛盾こそが囚人のジレンマです。

用語解説

最適反応

相手がある戦略を取るときに、自分が取るべき最適な戦略。

支配戦略

相手がどんな戦略を取ったとしても、自分の最適反応は全て同じであるときの、その戦略のこと。

囚人のジレンマの「自白」は支配戦略です。相手が自白しても黙秘しても、自分の最適反応は自白なので。

ナッシュ均衡

ナッシュ均衡とは各プレイヤーの最適反応の組み合わせの事です。ナッシュは経済学者の名前から来ています。

囚人のジレンマで言うとこの場所。

f:id:chiaki-hagisaka:20210420212942j:image

パレート改善

パレート改善とは、ある状態を、その状態の完全上位互換の状態に変えることです。

誰も損することなく全体の利益を増やすことをパレート改善する、と言います。

ちなみにパレートとは経済学者の名前です。

パレート最適

パレート最適とは、それ以上パレート改善の余地がない状態のことです。パレート効率的とも言います。この状態から他の状態に移動させようとすると、誰かしらが多かれ少なかれ損します。

囚人のジレンマで言うと3つあって、一つは直感的にも分かりやすいここ。

f:id:chiaki-hagisaka:20210420213147j:image

(2、2)は他のどの状態に移行しようしても、どちらか、あるいは両方が損してしまうので、パレート最適です。

では残り2つはどこか。

実は(0、10)も(10、0)もパレート最適です。

なぜなら他の状態に移行しようとすると、どちらか片方が必ず損をしてしまうからです。

実際にゲーム理論をどう活用するか

ゲーム理論はあらゆる戦略的状況を対象にしています。

例えば会社において

新人を2人、同じ給料で雇ったとします。上司は彼らに「協力して一つの仕事をしなさい」と命令しました。翌週上司が仕事の進歩状況を確認すると、なんと全然進んでいないではありませんか。これはいったいどういうことか。

この状況はゲーム理論によって説明できます。

新人2人にはそれぞれ「真面目に働く」「サボる」という戦略があり、この場合だと互いに「サボる」が支配戦略となってしまい、生産性の落ちた状態がナッシュ均衡となります。

この問題を解決、つまりパレート改善するためには「真面目に働く」という戦略へのインセンティブを高めなければいけません。

方法としては「働いた分だけボーナスを増やす」などがあります。

ゲーム理論を知ることによって、状況を分析することができ、改善策を考えたり最適な戦略を選択できるようになります。

囚人Aが選んだのは……

(…………でも、もし、Bが裏切ったら?)

Aは瞑目し、じっくりと考える。

(Bが裏切れば俺は自白しないと懲役10年になってしまう。それだけは絶対に避けたい。だとすれば、俺は自白するしかないのか?)

そこまで考え、Aはふと思い出したことがあった。

(いや、待て。確かあの事件の時、Bは俺を逃がそうとしていた。自分が囮になって警察を引きつけようとしていた。Bを1人置いていけなくて、結局俺も捕まってしまったけど、あの時のBは自分を犠牲にすることを選んだ。……なら、俺が今選ぶべきは)

「「黙秘する」」

AとBは、別々の部屋で、きっぱりとそう検事に告げた。

この時のABの戦略(意思決定と行動)は「しっぺ返し戦略」と呼ばれるものです。

簡単に言うと、「相手が裏切るまで自分も裏切らない。相手が裏切ったら自分も裏切る」という戦略です。

ABは「警察からの逃走」と「検事からの司法取引」の2回のゲームを行なっていて、1回目のゲームでは裏切りではなく協調を互いに選んだので、2回目も協調を選んだということです。

詳しく知りたい方はこちら↓

ゲーム理論はまだまだ奥が深いので興味があったら調べてみて下さい。

経済学のおすすめの参考書

タイトルとURLをコピーしました