囚徒困境 (The Prisoner's Dilemma):為什麼理性的選擇,最後卻造成了雙輸?揭開「賽局理論」最殘酷的一頁
你是否想過這些問題:
- 為什麼兩家加油站明明可以一起維持高價賺大錢,最後卻總是陷入削價競爭,搞得雙方都沒利潤?
- 為什麼各國都知道減少碳排放對地球好,但誰也不願意先帶頭減碳?
這不是因為人類愚蠢,恰恰相反,這是因為人類太「理性」了。
這就是賽局理論(Game Theory)中最著名的模型——「囚徒困境 (The Prisoner's Dilemma)」。它揭示了一個令人絕望的真相:個人的理性選擇,往往導致集體的瘋狂與毀滅。
經典場景:你要招供,還是保持沈默?
想像你和同夥被警察抓了,分別關在兩間隔離的審訊室裡。警察沒有足夠證據定你們重罪,除非有人招供。警察給了你們同樣的條件:
- 如果你們都保持沈默(合作): 證據不足,各判 1 年。
- 如果你招供(背叛),同夥沈默: 你轉做污點證人 當庭釋放,同夥判 10 年。
- 如果你們都招供(互相背叛): 證據確鑿,各判 5 年。
整體來看,最好的結果顯然是「都沈默」(共坐牢 2 年)。但在那個小房間裡,你的大腦會開始瘋狂計算。
為什麼「背叛」是唯一解?
你會這樣想:
- 假設同夥沈默:我如果沈默判 1 年,但我如果招供是 0 年。所以我該招供。
- 假設同夥招供:我如果沈默判 10 年(當冤大頭),但我如果招供是 5 年。所以我還是該招供。
發現了嗎?無論對方怎麼選,對你個人而言,「招供(背叛)」永遠是利益最大化(或傷害最小化)的選擇。
這就是諾貝爾獎得主約翰·納許 (John Nash) 提出的「納許均衡 (Nash Equilibrium)」。當兩個囚徒都做出最理性的決定(互相招供)時,他們卻迎來了僅次於最糟的結局(各判 5 年),錯失了原本觸手可及的雙贏。
現實生活中的囚徒困境
這個理論解釋了無數的人類行為:
- 價格戰: 蝦皮和 PChome 都知道停止補貼能賺錢,但誰先停誰就丟失市佔率,於是雙方只能無止盡地燒錢。
- 軍備競賽: 美國和蘇聯都知道不造核武最省錢也最安全,但萬一我沒造你造了怎麼辦?結果雙方都造了足以毀滅地球 10 次的核武。
- 辦公室加班: 大家都知道準時下班最健康,但如果別人加班你不加,老闆會覺得你偷懶。結果所有人都留下來「表演加班」,效率卻沒提升。
結語:如何打破困境?
囚徒困境看似無解,但並非絕路。破解的關鍵在於「重複賽局 (Repeated Game)」。
如果這場遊戲只玩一次,背叛是最佳解。但如果我們要玩很多次(例如長期的生意夥伴、鄰居),「信任」就有機會建立。這時,最佳策略會變成「以牙還牙 (Tit for Tat)」——你合作我就合作,你背叛我就懲罰。
這也是為什麼在充滿背叛的商業世界裡,「信用」依然是最昂貴的貨幣。
