深夜福利网-深夜福利网站大全,国产一区二区三区久久精品,99re6热在线精品视频播放,日韩中文字幕视频免费,影院一区二区小说性鲍视频

知名百科 >> 囚徒困境 >> 歷史版本
編輯時(shí)間歷史版本內(nèi)容長(zhǎng)度圖片數(shù)目錄數(shù)修改原因
2023-09-28 09:40 最新歷史版本 11782 4 3 調(diào)整頁(yè)面
  返回詞條

囚徒困境

囚徒困境是美國(guó)蘭德公司的美林公司在1950年首先解決了這個(gè)難題·弗勒德(Merrill Lynch   flood)和梅爾文·德雷希爾(Melvin   Deresjo)提出假說(shuō)理論,后來(lái)由艾伯特·塔克(  aluminum strip   excavator)命名的理論。其主要理念是:基于對(duì)彼此的不信任和自身利益的最大化,博弈雙方往往會(huì)選擇不利的選擇,從而導(dǎo)致利益最小化。

其情節(jié)為:被抓后,共同犯罪的兩個(gè)人AB處于信息不對(duì)稱(chēng)狀態(tài),有三種情況:雙方均供認(rèn)不諱,被判處有期徒刑8年、一方認(rèn)罪一方否認(rèn),認(rèn)罪的被釋放,否認(rèn)的被判10年有期徒刑、雙方均否認(rèn)被判有期徒刑一年。對(duì)于集體來(lái)說(shuō),最優(yōu)解是“都不坦白”但出于自身利益的考慮,往往會(huì)選擇坦誠(chéng),導(dǎo)致雙方利益最小化。

囚徒困境兩難博弈在生活中隨處可見(jiàn),在政治學(xué)中也有廣泛的應(yīng)用、經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、商業(yè)、在正義領(lǐng)域,  體現(xiàn)在軍備競(jìng)賽上、征地問(wèn)題、公益訴訟問(wèn)題、關(guān)稅戰(zhàn)、市場(chǎng)價(jià)格戰(zhàn)、訴訟、勇敢的困境等,每個(gè)困境都有一個(gè)從納什均衡到帕累托最優(yōu)解的解,可能需要很多次博弈才能慢慢接近最優(yōu)解。通過(guò)學(xué)習(xí)基礎(chǔ)理論,重復(fù)囚犯 的兩難博弈是擴(kuò)展的、太空囚犯 兩難游戲、不對(duì)稱(chēng)囚犯 的困境博弈,每個(gè)模型都有助于雙方更理性地合作。類(lèi)似于囚徒 的兩難博弈模型,有雪堆博弈和公共物品博弈囚犯 的困境反映了集體理性和個(gè)人理性之間的沖突理性人 個(gè)人的理性行為可能導(dǎo)致集體的非理性,理性的人會(huì)為了自己的最大利益而行動(dòng)為了實(shí)現(xiàn)集體最優(yōu)解,個(gè)體需要克制對(duì)自身利益的追求。在現(xiàn)實(shí)生活中,人與人之間應(yīng)該相互信任,建立合作關(guān)系。

目錄

理論內(nèi)涵

假設(shè)兩個(gè)犯人共同犯罪,被抓入獄后都想盡快釋放,警察就把他們分開(kāi)關(guān)押審問(wèn),并告知:如果一個(gè)人坦白而另一個(gè)人不坦白t,坦白的一方將因立功立即釋放,不坦白的一方將被判10年 監(jiān)禁;如果兩人都坦白,因?yàn)樽C據(jù)確鑿,每人判 83356;如果兩人都否認(rèn),因證據(jù)不足,各人被關(guān)押 13356年后釋放。在這套規(guī)則下,基于理性人的考慮,兩個(gè)囚犯群體的帕累托最優(yōu)解是“都不坦白”但最后兩人都坦白了,各被判八年。博弈論為囚徒困境提供的納什均衡解s的困境是雙方都坦白,但利益沒(méi)有最大化。

典型的2*2囚犯 的兩難博弈模型有四種結(jié)果:合作, 作品),(合作,背叛),(背叛,合作),(背叛,背叛)當(dāng)雙方選擇合作時(shí),收益最高;當(dāng)一方選擇背叛時(shí),選擇背叛的一方會(huì)獲得更高的收益,但當(dāng)雙方都選擇背叛時(shí),各自都會(huì)獲得收益,但對(duì)于集體來(lái)說(shuō),收益會(huì)減少(與選擇合作的好處相比,)個(gè)體理性帶來(lái)集體非理性。囚犯 的困境表明,兩個(gè)個(gè)體在爭(zhēng)奪利益時(shí),都是以大局為重,愿意合作的、合作共贏,或者重視個(gè)人利益,往往會(huì)背叛對(duì)方、互相欺騙,游戲的結(jié)果是雙方同時(shí)背叛,因?yàn)槿祟?lèi)有自私的天性。

理論應(yīng)用

政治學(xué)

軍備競(jìng)賽

為囚犯 在國(guó)家博弈中,美蘇爭(zhēng)霸就是一個(gè)典型的例子在冷戰(zhàn)背景下,擺在兩國(guó)面前的有兩種選擇:裁軍還是擴(kuò)張,有四種情況:當(dāng)雙方都選擇擴(kuò)軍時(shí),雙方相互對(duì)抗,付出更多成本進(jìn)一步擴(kuò)軍,加劇了戰(zhàn)爭(zhēng)風(fēng)險(xiǎn);當(dāng)一方選擇擴(kuò)軍時(shí),實(shí)力不對(duì)等的一方受到的戰(zhàn)爭(zhēng)威脅更大;雙方都解除武裝,就不需要支付額外費(fèi)用,也沒(méi)有戰(zhàn)爭(zhēng)風(fēng)險(xiǎn),但兩國(guó)都不會(huì)選擇這個(gè)選項(xiàng)。雖然雙方裁軍是普拉提的最優(yōu)解,但從國(guó)家角度來(lái)說(shuō),擴(kuò)軍永遠(yuǎn)比裁軍更有利。

政府評(píng)價(jià)

在政府績(jī)效評(píng)估中,政府有兩種選擇:主動(dòng)組織、被動(dòng)接受;公眾有兩種選擇:主動(dòng)參與、被動(dòng)參與。會(huì)出現(xiàn)四種結(jié)果:政府積極組織,公眾積極參與;政府主動(dòng)組織,公眾被動(dòng)參與;政府被動(dòng)組織,公眾主動(dòng)參與;政府被動(dòng)組織,公眾被動(dòng)參與。這不同于傳統(tǒng)的囚犯 的困境模型這種情況下,雙方都主動(dòng),利益最大化,雙方都不主動(dòng),就意味著成本降低、手續(xù)簡(jiǎn)化了,但不利于社會(huì)的長(zhǎng)遠(yuǎn)發(fā)展。

經(jīng)濟(jì)學(xué)

關(guān)稅戰(zhàn)

美國(guó)和中國(guó)的關(guān)稅戰(zhàn)是2*2囚犯 的困境重復(fù)博弈,雙方的最優(yōu)解是(合作,合作)但由于美國(guó)數(shù)次背叛,態(tài)度多變,中國(guó)在博弈中慢慢走向?qū)α⒌囊环?,最終演變成(對(duì)抗,對(duì)抗)即雙方都選擇不合作,損害了雙方的利益。游戲在反復(fù)進(jìn)行面對(duì)中國(guó)想合作而美國(guó)選擇對(duì)抗的態(tài)度,只有不斷反擊美國(guó)的背叛,美國(guó)才會(huì)吃虧在隨后的博弈中,美國(guó)會(huì)改變對(duì)華戰(zhàn)略,從而從背叛走向合作。

征地

政府希望征用土地來(lái)促進(jìn)城市建設(shè),農(nóng)民希望得到補(bǔ)償來(lái)彌補(bǔ)收入減少的損失。理想結(jié)果是:農(nóng)民可以從政府設(shè)定的補(bǔ)償中受益;現(xiàn)實(shí)情況是:一些農(nóng)民要價(jià)過(guò)高或采取激進(jìn)措施反對(duì)征地,政府只能強(qiáng)制征收或重新談判,導(dǎo)致雙方利益受損。一方的選擇原本是希望給自己帶來(lái)更多的利益,結(jié)果卻是利益更少。

商業(yè)

價(jià)格戰(zhàn)

商業(yè)競(jìng)爭(zhēng)對(duì)手降價(jià)搶占市場(chǎng)份額,最終導(dǎo)致整個(gè)行業(yè)利潤(rùn)下降。假設(shè)商家1價(jià)格不變,商家2降價(jià),消費(fèi)者會(huì)被商家2吸引,商家2會(huì)獲得更多利潤(rùn);如果商家1降價(jià),商家2會(huì)更降價(jià),否則商家1會(huì)搶占商家2的客戶(hù)。因?yàn)槲也徊恢缹?duì)方會(huì)不會(huì)降價(jià),有些人會(huì)選擇降價(jià)來(lái)吸引游客最后的結(jié)果就是每個(gè)商家都選擇降價(jià),陷入低價(jià)競(jìng)爭(zhēng)的惡性循環(huán)。以快遞行業(yè)為例,以?xún)r(jià)換量的價(jià)格混戰(zhàn)導(dǎo)致行業(yè)發(fā)展陷入困境。

廣告

A、b是兩家公司,他們會(huì)理性選擇廣告策略會(huì)有四種情況:甲做廣告,乙做廣告;甲做廣告,乙不做廣告不打廣告;一個(gè)沒(méi)有 t做廣告,B做廣告;甲不打廣告,乙不打廣告。如果A不 t做廣告,B不做廣告t打廣告,兩家公司都會(huì)有利潤(rùn),而且利潤(rùn)是對(duì)等的;如果A做廣告而B(niǎo)不做t打廣告,那么A利潤(rùn)高,B利潤(rùn)低,反之亦然;然后B也會(huì)跟風(fēng)做廣告最終兩家公司的利潤(rùn)都會(huì)因?yàn)閺V告費(fèi)用太高而減少。這里的最優(yōu)解是兩家公司都不做廣告,但能提高整體市場(chǎng)收入。

領(lǐng)導(dǎo)決策

領(lǐng)導(dǎo)決策過(guò)程中有兩個(gè)決策者a和 B,有四種可能:較低級(jí)別的A執(zhí)行,較低級(jí)別的B執(zhí)行;下層A執(zhí)行,下層B不執(zhí)行;下級(jí)不執(zhí)行a,下級(jí)執(zhí)行B;下屬A不執(zhí)行,下屬B不執(zhí)行。對(duì)于A,無(wú)論B執(zhí)行與否,最優(yōu)解都是執(zhí)行這樣才能獲得領(lǐng)導(dǎo)的賞識(shí),對(duì)B也是如此,所以最優(yōu)解是執(zhí)行AB但如果把AB看成一個(gè)整體,領(lǐng)導(dǎo)決策的執(zhí)行可能會(huì)受到贊賞批評(píng),出錯(cuò)的可能性更高。對(duì)于集體來(lái)說(shuō),沒(méi)有一個(gè)會(huì)把被批評(píng)的可能性降到最低。然而,在現(xiàn)實(shí)生活中,A和B為了提升自己的職位,將對(duì)方視為競(jìng)爭(zhēng)對(duì)手,互不信任,選擇在不告知對(duì)方的情況下執(zhí)行決策雖然有多做多錯(cuò)的風(fēng)險(xiǎn),但領(lǐng)導(dǎo)還是可以利用的“囚徒困境”使其決定得到實(shí)施。

司法

訴訟

作為公共物品的提供者,環(huán)境公益訴訟就是一個(gè)典型“集體行動(dòng)”環(huán)境損害會(huì)對(duì)社會(huì)產(chǎn)生負(fù)外部性,但當(dāng)環(huán)境損害的影響在個(gè)人之間平均分擔(dān)時(shí),對(duì)當(dāng)事人的影響很小。有訴訟資格的原告費(fèi)用自理、風(fēng)險(xiǎn)自擔(dān)、在收益分成的前提下,為了個(gè)人利益,不會(huì)選擇訴訟,而是等著別人提起訴訟,坐享其成但是對(duì)于集體來(lái)說(shuō),結(jié)果是沒(méi)有人提起訴訟,因?yàn)檫@個(gè)活動(dòng)帶來(lái)的私人利益小于社會(huì)利益,導(dǎo)致囚徒 的困境雖然訴訟對(duì)原告有利,但大家都選擇不提起訴訟。

司法執(zhí)行

法院與被背信人之間是一種關(guān)系“靜態(tài)博弈”兩者之間有四種結(jié)局:被執(zhí)行人履行判決時(shí),法院采取相關(guān)執(zhí)行措施;被執(zhí)行人不履行判決的,法院應(yīng)當(dāng)采取相關(guān)強(qiáng)制執(zhí)行措施;被執(zhí)行人履行判決的,法院不采取相關(guān)執(zhí)行措施;被執(zhí)行人履行判決的,法院不采取相關(guān)執(zhí)行措施。不同于普通的囚犯s困境博弈,雙方都沒(méi)有合作,沒(méi)有獲得最大利益,反而擴(kuò)大了損失這是因?yàn)椴扇?qiáng)制執(zhí)行措施是法院的義務(wù)“非正常合作”最終雙方利益受損、結(jié)局二法院受損、結(jié)局三雙方獲利、第四種結(jié)果是被執(zhí)行人受損。

審訊

在現(xiàn)實(shí)中,偵察機(jī)關(guān)在審訊過(guò)程中可以依賴(lài)它“囚徒困境”靠策略得到坦白是很罕見(jiàn)的,因?yàn)殡p方都可以 不要達(dá)到絕對(duì)的理性在更理性的情況下,雙方可能會(huì)選擇不同時(shí)坦白,因?yàn)檫@樣可能會(huì)逃避懲罰。在囚徒 美國(guó)困境,博弈雙方都追求個(gè)人利益最大化的目標(biāo),但中國(guó) s“坦白”制度帶來(lái)的預(yù)期收益與實(shí)際損失不成比例,導(dǎo)致不會(huì)陷入選擇的困境?,F(xiàn)實(shí)的法律規(guī)則是:假設(shè)罪名可能判十年,如果兩人都否認(rèn),會(huì)因證據(jù)不足被判無(wú)罪; 如果兩人都坦白,各判八年;如果其中一個(gè)坦白了,、一人否認(rèn),從輕處罰六年,從重處罰十年。刑期相差不大,犯罪者更可能選擇否認(rèn)。在這種情況下,有三種解決方案:一種是幫助嫌疑人分析利弊,做出理性選擇,也就是坦白;二是制造信息不對(duì)稱(chēng),防止合謀,讓對(duì)方做出更有利的選擇,也就是告白;三是找到利益的平衡點(diǎn),也就是表白坦白對(duì)個(gè)人來(lái)說(shuō)不是最優(yōu)解,但對(duì)集體來(lái)說(shuō)是最有利的。一般來(lái)說(shuō),一些犯罪情節(jié)輕微的共同犯罪比較容易通過(guò)“囚徒困境”策略找到突破口。

社會(huì)

見(jiàn)義勇為困境

一老太太在公交站臺(tái)摔倒,路人扶起她,被敲詐法院判賠,背離了社會(huì)主流價(jià)值,打擊了大眾的傳統(tǒng)道德觀念。

理論影響

博弈論研究者提出各種假設(shè),研究人類(lèi)的行為動(dòng)機(jī),并不斷補(bǔ)充、完善博弈論體系,成效顯著。學(xué)者道斯從合作與非合作行為動(dòng)機(jī)的角度,認(rèn)為部分參與者擔(dān)心只有單方面選擇合作才能獲得博弈的最低收益;有學(xué)者如Bacharach認(rèn)為原因是人具有集體理性,追求利益最大化而不是個(gè)人利益,而Andreoni 認(rèn)為是利他主義和聲譽(yù)促進(jìn)了合作?;ダ糙A理論的本質(zhì)是追求利益最大化。

基于囚犯 Selten和Stoecker 研究發(fā)現(xiàn),只要對(duì)立的玩家愿意合作,并且看好對(duì)方 他們可以改變策略,在一些競(jìng)爭(zhēng)中取得成功;利伯曼等學(xué)者研究了聲譽(yù)和虛擬名字對(duì)玩家選擇和合作的影響;Cox et al研究證實(shí),文化差異對(duì)合作或非合作行為有很大影響。Boone 和Witteloustuijn討論 具有行為博弈或經(jīng)濟(jì)博弈知識(shí)的參與者更有可能選擇合作行為。Sabater-Grande 和Georgentzis  討論了風(fēng)險(xiǎn)偏好類(lèi)型的影響,指出風(fēng)險(xiǎn)厭惡者傾向于選擇背叛。孟祖輝認(rèn)為, 名參與者 對(duì)人的信任也會(huì)影響他們的行為決策。馬本江和邱研究如何擺脫囚犯 得出的結(jié)論是博弈雙方在理性條件下增加了博弈的約束規(guī)則。

基于空間博弈模型,Perc 研究了空間囚徒困境中的隨機(jī)收入變化s困境博弈模型可以促進(jìn)合作;諾瓦克和梅將空間網(wǎng)絡(luò)結(jié)構(gòu)與囚徒 s困境博弈模型,指出個(gè)體之間的空間結(jié)構(gòu)可以促進(jìn)合作,并發(fā)現(xiàn)最佳的模仿策略可以促進(jìn)合作的形成,提高整體合作水平。

基于不對(duì)稱(chēng)博弈模型,紐曼-Watts 研究了囚犯 不對(duì)稱(chēng)收入分配機(jī)制下的s困境博弈模型在某些情況下,窮人會(huì)被富人剝削,富人會(huì)更富在某些情況下,窮人會(huì)被富人救濟(jì),財(cái)富會(huì)被重新分配。

標(biāo)簽