學習成長

2023.10.05 | 1934次觀看

囚犯困境、智豬賽局...身處賽局結構中該如何掌握「奈許均衡」提升幕僚賽局力?

「賽局理論」你我或多或少皆曾聽聞囚犯困境、智豬賽局、膽小鬼賽局、棋盤賽局等經典賽局案例,了解賽局結構全貌、參與者會做出什麼行動與選擇。如何掌握賽局、讓方向朝向我們期望的結果?賽局結構中至關重要的「奈許均衡」如何分析出所有參與者最有機會做出的選項組合?

文/劉奕酉 由方格子授權轉載

上一篇文章中,我介紹了什麼是賽局,以及囚犯困境這個經典的賽局案例。

我想你也明白了身處於這樣的賽局結構時,該如何破解困境?可以如何透過制度的設計來扭轉整個局面,往我們期望的方向發展?

事實上,賽局結構有許多不同的樣貌,像是協調賽局、膽小鬼賽局、棋盤賽局等等,而囚犯困境只是其中一種相對好理解的賽局類型。但不論是哪一種賽局結構,在掌握結構的全貌之後,我們必須先找出賽局中的參與者會做出什麼樣的選擇、為什麼會做出這樣的選擇?我們才有機會進一步找到改變賽局的手段。

掌握賽局只是基本,改變賽局往我們期望的結果才是最終的目的。

孫子兵法中有句「知彼知己者, 百戰不殆」正是這個概念。不過,你可能很納悶:我怎麼會知道其他人的選擇呢?即使我問了,對方也不見得會告訴我;如果用猜的,萬一錯了怎麼辦?

的確,學會賽局並不表示你擁有一顆水晶球,知道未來可能發生的一切。

但也不是完全不可預測,至少我們可以利用模型推估找出可能的選項組合、做出最合適的選擇。要做到這一點,就必須先了解「奈許均衡」這個在賽局理論中非常重要的觀點。透過奈許均衡,我們可以找出讓賽局維持平衡的選項組合,也就是賽局中的所有參與者,最有機會做出的選項組合是什麼?

奈許均衡:雙方都做出最利已的舉動,使賽局達成一種均衡狀態

奈許均衡,是諾貝爾經濟學獎得主、美國數學家奈許(John F. Nash)所提出的。 他認為只要賽局的結構可以被描繪出來,就能找出符合奈許均衡的選項組合,這是雙方都認為做出對自己最有利的舉動,而使得賽局維持一種均衡的狀態。我們只要確認了奈許均衡所在的位置,就能知道雙方最有機會做出的選項是什麼。

舉例來說,在囚犯困境中,兩個囚犯之所以都會做出認罪的選擇,是因為這是符合奈許均衡下的最佳選項,也就是「雙方都做出對自己而言最有利的舉動」的選項組合。

那麼,該如何找出奈許均衡所在的位置呢?就以囚犯困境為例來說明吧!

第一步,根據囚犯困境的條件,我們可以畫出賽局的結構如下

第一步,根據囚犯困境的條件,我們可以畫出賽局的結構

第二步,從囚犯A或囚犯B任何一人開始進行合理選項的推論

首先,站在囚犯A的立場來思考,會有兩種假設的可能性:

  1. 假設囚犯B選擇不認罪,那麼囚犯A選擇認罪的報酬是「無罪」,而選擇不認罪的報酬是「一年」刑期,所以選擇認罪對囚犯A是較有利的,我們在這個「無罪」上面畫個紅色圈圈。
  2. 假設囚犯B選擇認罪,那麼囚犯A選擇認罪的報酬是「五年」刑期,而選擇不認罪的報酬則是「死刑」,所以選擇認罪對囚犯A是較有利的,我們在這個「五年」上面畫個紅色圈圈。

這時候,站在囚犯A的立場,無論囚犯B的選擇是什麼,自己選擇「認罪」都會是最有利於自己的選項。

第二步,從囚犯A或囚犯B任何一人開始進行合理選項的推論

其次,換站在囚犯B的立場來思考

  1. 假設囚犯A選擇不認罪,那麼囚犯B選擇認罪的報酬是「無罪」,而選擇不認罪的報酬是「一年」刑期;選擇認罪對囚犯B是較有利的,我們在這個「無罪」上面畫個藍色圈圈。
  2. 假設囚犯A選擇認罪,那麼囚犯B選擇認罪的報酬是「五年」刑期,而選擇不認罪的報酬則是「死刑」,所以選擇認罪對囚犯B是較有利的,我們在這個「五年」上面畫個藍色圈圈。

現在,我們也完成了站在囚犯B的立場,會做出那些有利於自己的選項。

站在囚犯B的立場,會做出那些有利於自己的選項

最後,在賽局結構中,擁有最多圈的,就是符合奈許均衡的選項組合。

在賽局結構中,擁有最多圈的,就是符合奈許均衡的選項組合。

在囚犯困境這種賽局結構中,選擇認罪就是對雙方而言做出對自己而言最有利的舉動,達到了奈許均衡。現在你清楚了如何找出奈許均衡的選項組合了嗎?

接下來,我會用另一個賽局結構,來讓你理解如何透過奈許均衡找出合理的下一步。

合理的豬:弱者也能掌控局面的一種賽局結構

在賽局理論中有一個有趣的賽局結構,叫做「合理的豬」也有人稱為智豬賽局

在這個賽局中假設是這樣的:

  • 有一條很長、很長的豬圈,一頭是飼料槽,而踏板在另外一頭。
  • 每踩一次踏板,另一頭的飼料槽就會掉下十份飼料。
  • 在這個豬圈中有一頭大豬、一頭小豬,由於踩踏板的豬必須從豬圈的一端跑向另一端才能吃到食物,不論誰去踩踏板,代價都會消耗相當於兩份飼料的熱量。

問題來了,到底誰該去踩踏板呢?大豬和小豬會如何選擇呢?

合理的豬:弱者也能掌控局面的一種賽局結構

在這個賽局結構中,給出了四種情況的假設

  1. 第一種,大豬、小豬都不去踩,結果誰也沒得吃,所以報酬都是零份。
  2. 第二種,小豬去踩踏板、大豬守在飼料槽旁邊,結果十份飼料都被大豬吃完了,小豬完全沒吃到;所以,大豬獲得了十份報酬,小豬獲得了負二份的報酬。
  3. 第三種,大豬去踩踏板、小豬守在飼料槽旁邊,當大豬跑回來後還能搶到六份飼料,小豬吃了四份飼料;所以,大豬扣除掉體力消耗後獲得了四份報酬,小豬也是四份報酬。
  4. 第四種,大豬、小豬都去踩踏板,跑回來後大豬吃了七份、小豬只吃到三份;所以,扣除體力消耗後,大豬與小豬的報酬分別是五份、一份。
在這個賽局結構中,給出了四種情況的假設

我知道你會覺得納悶,為何會有這樣的假設?這是為了說明奈許均衡的存在,在真實世界中我們可能不知道假設是什麼,也可能需要定義出這些假設,而且並不是那麼容易。不過,先讓我們看下去這個賽局的發展吧。

當我們將這四種情況整理為賽局的結構,可以得出下面這樣的結果。當我們分別以大豬、小豬的角度來思考,就能找出奈許均衡是在「大豬採、小豬不採」的組合,這也是他們的最佳策略。

奈許均衡是在「大豬採、小豬不採」的組合,這也是他們的最佳策略。

換句話說,小豬等著吃就好。

在奈許均衡下,策略是小豬不踩、大豬踩。如果大豬改變了策略,決定不踩,那麼大豬能吃到的飼料,就會從四份降到零份,所以大豬不會這麼做;反過來說,如果是小豬改變了策略,那麼能吃到的飼料,就會從四份降為一份,所以小豬也不會這麼做。

當雙方都清楚可能產生的結果時,自然會選擇這樣合理的策略

在奈許均衡下,若是單方面改變策略就會遭受損失;所以彼此都會維持奈許均衡下的選擇,大豬踩、小豬不踩,可以各吃到四份是最好的策略。在最佳策略下小豬明顯佔了優勢,可以什麼都不做,只等著吃就好,因為大豬一定會去踩;所以這個賽局又被稱為「搭便車」賽局

現實中處處可見的搭便車賽局

在真實世界中,也存在著不少類似的搭便車賽局。

比方說,小型建商或政商關係良好的人,先鎖定預定開發地周邊的地,然後等大型建商把預定開發地炒起來後,搭便車獲利。或者是,當大型企業推出成功商品之後,許多小型企業也會順勢推出相似商品來瓜分市場大餅。

真不公平,對吧?既然知道了賽局結構,當然就可以去改變。

如果這些大型企業或建商懂得搭便車賽局的概念,就會做出對應的策略來制約小豬心態,例如「專利保護」就是一種保護大豬的制度設計,在飼料槽中鎖定一塊區域,只給踩踏板的大豬獨享,不用擔心到頭來為他人作嫁。

在職場上也存在著這類賽局,常聽到的「能者多勞」就是一種搭便車賽局

但是管理者如果不懂得約束小豬(不做事的同仁),就會發生劣幣驅除良幣的問題,導致勤奮工作的人受到挫敗,而陸續離開。那麼,管理者該如何處理這個問題呢?

在搭便車賽局中,維持均衡的假設條件是:踩踏板的豬,一定要比不踩踏板的豬吃得多

所以破壞這個奈許均衡的假設,就是管理者將激勵給個人、而不是整個團隊雨露均霑。讓團隊知道不做事就會餓死;即使團隊全體都能獲得激勵,有做事的人能獲得的比例也遠大於不做事的。如此一來,也能減少小豬的出現。

在多數情況下,規則都是由強者來制定,對於弱者來說,抓住有限的規則優勢為自己謀取利益無可厚非,這是弱者的求勝之道,也是將弱勢轉化為競爭優勢的策略,這也是懂得賽局的好處。

現在,我想你應該明白了如何找出賽局結構中的奈許均衡,確認賽局中雙方都做出對自己最有利的舉動是什麼?也學到了「合理的豬」這個又稱之為「搭便車」賽局的賽局結構。

我建議你不妨試著用合理的豬這個案例,找出奈許均衡為什麼是「大豬不踩、小豬踩」的選項組合?同時也想想看,在工作與生活的周遭,有沒有類似「合理的豬」這樣的搭便車賽局呢?

在靜態賽局中,奈許均衡的觀點十分重要,可以說對方會採取什麼樣的行動,大致上可以根據奈許均衡的結果推測出來。像是囚犯困境、搭便車賽局或協調賽局,都是假設所有參與者幾乎都是同時做決定的,沒有時間流的問題,不會有看到別人的決定之後,再來考慮自己要做出什麼決定,所以是一種靜態賽局或同步賽局。

但在現實世界中,不論企業或個人的決策可能會受到時間因素的影響,而有先後之分,所以又衍生出動態賽局的領域出來。在下一篇文章中,我想和你談談什麼是動態賽局?關於動態賽局的結構、預測方式,以及如何在賽局中找出最好的應對策略?

(原文標題:打造超級幕僚#19|幕僚的賽局力:如何看懂局、預測對手的下一步?學會「奈許均衡」做出合理的選擇

【關於方格子】以多元模式創造價值,期望讓每位專注的創作者自在分享、交流。在104發表的文章,都是由方格子創作者各別創作,透過「方格子直送」計畫授權轉載。
方格子網站  方格子臉書粉絲頁


在職場上【學習成長】的更多思考,這些觀點供您參考

加入粉專,每天收看職場力最新文章