生活中的博弈 09 第二章 囚徒困境:进退两难的抉择 1合作还是背叛

2020-09-17 17:30:01大叔不冷17:16 203
声音简介

博弈论囚徒困境

既然两个人选择抵赖的收益高于坦白的收益,但是博弈的最终结果却都是选择坦白, ===================> 这里的描述是不完整的。必须有条件: 1、自己抵赖,而且【被】对方揭发,这种情况的惩罚非常非常【严重】,远远重于其它情况 2、两名囚徒,不能见面,不能有【互相串供】 【建议】:楼主(WTF64)你,应该将【前提】条件记完整。 从经济学角度怎样来解释这种似乎矛盾的选择 ===================> 补充完整条件之后,解答还是比较容易。 经济学的基本假设之一就是理性经济人,即每个经济人都是理性的。 在两名囚徒之间信息不【充分】的条件之下,例如不能有【互相串供】,选择【坦白、并揭发对方】,是对自己最有利的 如果觉得满意的话,请选一下那个【满意】哦。谢谢……

囚徒困境的博弈问题

因为环境诱因导致双方对利益需求互不退让,因而无数次得博弈后仍不得其解,恋人们的海誓山盟是基于当下的感官升华,我觉得和博弈不是很搭界……

囚徒困境,海盗分金的博弈思想是什么

是博弈论中两个基本模型,互惠共赢是它的主要思想

囚徒的困境——与其背判是什么意思?

在囚徒困境中,选择招供,也就是背判是理性的,这一论断与我们的传统观念并不相等。如果人人都这样想问题,那么就没有诚信可言了。 出现这一问题的原因是:现实中的情况和囚徒困境并不一样,困境中的两个囚徒互不相识,被判出狱后可能老死不相往来。现实生活中却并非如此,人们都在进行着重复的博弈,就是同样结构的博弈也要重复多次,人们可能在次数不定的博弈中与其他人重复交手。 其实“善有善报”的观念并不是一种迷信思想,从另一个角度看,它是有科学依据的。

囚徒困境:信任无价,背叛有价

我们来看一个故事: 警察抓获两名嫌疑犯A和B,他们是一同作案的,警方将他们分别放到两个房间里隔离审讯。他们彼此都不知道同伴跟警察说了什么。 警方的政策是“坦白从宽,抗拒从严”: 1、如果两个人都认罪,各判5年; 2、如果两个人都不认罪,则各判1年; 3、如果只有一个人认罪,那么认罪的这个人将被释放,不认罪的那个人要判10年。 如果你是其中一名囚徒,你会怎么选择? 当然,我们站在旁观者的角度看,是一目了然,那最优策略就是,两人都选择不认罪,也就是包庇对方,每个人只会被判1年。 然而,作为当事人的囚徒的内心却是非常复杂的。见下图分析: 以A囚徒来来分析,存在B囚徒认罪和不认罪的两种可能。 1、B囚徒没认罪。存在两种情况: (1)A囚徒认罪,会被无罪释放; (2)A囚徒不认罪,会被判1年。 (1)(2)相比较,对A囚徒来说,认罪是更优的策略。 2、B囚徒认罪。存在两种情况: (1)A囚徒也认罪,会被判5年; (2)A囚徒不认罪,就要被判10年。 (1)(2)相比较,认罪仍然是对A囚徒来说最优的方案。 从以上两种情况分析,不难发现,无论B囚徒选择认罪或者不认罪,A囚徒的最优策略都是认罪。 这样一来,只要两名囚徒足够理性,几乎必然双双选择坦白从宽,各判5年,谁也没占到便宜。 这就是最早是由普林斯顿大学的数学家阿尔伯特•塔克在1950年提出的囚徒困境,分析见下图: 囚徒困境(prisoner's dilemma )是两被捕囚徒之间的一种特特的博弈论,它是博弈论中非零和博弈的代表性的例子。 当个人利益与集体利益发生冲突的时候,人们往往会优先追求个人利益。当大家都只考虑利己角度的时候,结果却是往往是损人不利己。 囚徒困境说明了为什么在合作对双方都有利的情况下,保持合作也是困难的。反映个人最佳选择并非团体最佳选择。 虽然困境本身只属模型性质,但现实中囚徒困境的例子屡见不鲜。比如现实中死价格竞争、环境保护、人际关系等等方面,也会出现类似情况。 比如前些年,彩电降价事件,厂家为了各自利益的最大化,都像囚徒那样进行了一番选择: 如果降价,可以赢得更大的市场。如果不降价,别人降价了,别人就会占领更大的市场。 因此不论别人怎样,对于自己厂来说,降价都是最优选择。当每一个厂家都作出这样选择时,彩电市场扰打起了一轮又一轮的价格战。结果是最后都遭受到重大损失。 路曰,一句话理解囚徒困境:背叛,也是有价格的,而聪明人懂得怎样让这个价格大到让对方不会背叛。 要如何摆脱囚徒困境呢,见下图分析: 一、增加背叛的成本。 以某种方式明确,一旦发生背叛行为,将会遭受到怎样的惩罚。 如果两名囚徒都知道对方的家在哪,能够威胁到对方妻儿老小的安危,那么他们之间相互的背叛的可能性就会减小。 在很多历史故事里,双方为了结盟,会采取用儿子作人质抵押,或嫁女和亲,如文成公主与松赞干布的联姻。 还有给员工一定的股份、约定合同违约金本质上都是为了增加对方的背叛成本!背叛也是有价格的! 二、引入第三方。 引进一个外在的监督站,减少博弈双方背叛机会,也是一种很常见的商业策略。 比如,第三方支付,支付宝,背书、担保、公证、婚前财产公正等等,将第三方作为一种信用中介,消除或减少买卖双方背叛的可能性! 三、重复博弈。 同一个博弈如果重复进行,如这两个囚徒连续被抓了100次,他们还敢轻易的选择背叛对方吗? 在这样的博弈中,任何一次背叛都会招致对方下一次的报复,我这一次出卖了你,你下一次就会加倍的出卖我! 这就使得我背叛你,弊大于利。也正是因此,大家都会倾向于彼此合作! 你到某旅游景点,下起了大雨,此时,平时在自家附近商店十元可买到的伞,在景点要卖五十元,你买不买? 你还得买,对景点商家来说,就是这次卖给你十元,你到他家再次买东西的机会也几乎为零。但你家附近商店就不一样了,他还指着你继续光顾他的商店呢。 投资自己,不当囚徒,就算当囚徒,咱也要少判几年。这个道理,你说对吗? 投资自己,让自身更具价值,以增加自己的分量和掌控权,做选择时自由度更高,不至于轻易陷入囚徒困境。 就算成为囚徒,自己给对方带来的利益远高于对方背叛自己后所能创造的利益,也会增大对方背叛的成本。 即使对方背叛了自己,其优势也能很快吸引到新的合作伙伴,损失也会小很多,让自己少判几年。 个人解读,仅供参考,抛砖引玉,欢迎留言探讨。

囚徒困境博弈实验 相关知识~跪求

现实生活中有很多这样的例子,比如 公告产品的供给,“如果大家都出钱兴办公共事业,所有人的福利都会增加。问题是,如果我出钱你不出钱,我得不偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以每个人的最优选择都是不出钱。” 囚徒困境反映了一个很深刻的问题。这就是个人理性与集体理性的矛盾。

囚徒困境是啥意思

这是博弈论的一个模型

什么是囚徒困境?是什么意思?

美丽的数学,伟大的纳什!!!一楼说得对极了,就是这个答案了

囚徒困境

囚徒困境是一种博弈模型。 一、囚徒困境的简介 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。 或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。 二、囚徒困境的出处 “囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德和梅尔文·德雷希尔拟定出相关困境的理论,后来由顾问艾伯特·塔克以囚徒方式阐述,并命名为“囚徒困境”。两个共谋犯罪的人被关入监狱,不能互相沟通情况。 如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。 由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型。 三、囚徒困境的故事 囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。 警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。 然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判十年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好。 结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性-聪明的人类会因自己的聪明而作茧自缚,或者损害集体的利益。 囚徒困境的主要内容 1、单次多重 单次和多次的囚徒困境,结果不会一样。在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。 这时,合作可能会作为平衡的结果出现。 欺骗的动机这时可能被惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。反复的、接近无限的重复次数时,纳什均衡趋向于帕累托最优,从互相背叛趋向于互相忠诚。 2、理论主旨 囚徒们虽然彼此合作坚不吐实,可为全体带来最佳利益,但在对方的表现不明的情况下,因为出卖同伙可为自己带来利益,也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。 但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作为必须考量的因素。

囚徒困境是什么啊?

囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,不坦白的话判十年,坦白还是比不坦白好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。但这个帕累托改进办不到,因为它不能满足人类的理性要求。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。

接下来播放