囚徒小说资源

囚徒困境的来源
1个回答2024-01-28 01:12

囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。但这个帕累托改进办不到,因为它不能满足人类的理性要求。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。 单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。
在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。 试想像囚徒困境的情况进行十次或以下。
我们可以合理地设想,如果囚徒第一次被对方指控,第二次这个囚徒也会指控对方。相反,如果第一次别人保持沉默,建立了互信的关系,你也会保持沉默,导致帕累托最优。
当然,两个囚徒都会有相似的想法,在第一局保持沉默,以期望建立互信关系,所以双方都会保持沉默。第二局时,双方亦应有相似的想法,继续保持沉默,以期继续在互信的情况下进行第三局,以致余下的八局。
这种想法合理吗?
在第十局时,互信的关系明显是没有意义的,因为十局已经完结,囚徒没有必要为维持互信的关系而沉默(没有第十一局),所以第十局囚徒一定会背叛对方的,理由和只有一局囚徒困境一样。
问题是,既然大家都知道在第十局,无论如何对方都会背叛自己的,你在第九局保持沉默也是没有意思的,要知道,保持沉默(友好关系)的原因是为了希望下一局别人保持沉默。所以第九局双方都一定会背叛对方的。
下一个问题是,双方都有相同的想法,明知第九局对方会背叛自己,所以第八局保持沉默也是没有意思的,第七局亦然,如此类推,纳什均衡是十局都会互相背叛,建立互信关系是没有可能的。
只有在囚徒困境的局数大家都不肯定的情况下,上述的推论才不会发生,才会出现互相保持沉默的现象。
以上推论即为“蜈蚣博弈”,它揭示了倒推法的缺陷。事实上,“囚徒困境”可以看成是一环的“蜈蚣博弈”。 例子
1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。
若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。
用表格概述如下:  甲沉默 甲背叛 乙沉默 二人同服刑1年 乙服刑10年,甲即时获释 乙背叛 甲服刑10年,乙即时获释 二人同服刑8年 解说
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益,这也就是经典经济学中的“理性人假设”。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
若对方沉默时,背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。

“囚徒困境”的内在根源是什么?
1个回答2023-06-13 02:46
囚徒困境的内在根源是特别懒。
囚犯医生的资源。
1个回答2023-08-16 00:50
英国也有囚犯?不可思议
谁有死囚乐园资源。
1个回答2023-06-30 22:46

死囚乐园资源

囚徒是什么意思吗
1个回答2024-02-07 22:56
囚徒是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团慧拦桥体衡正最佳选择。虽然本身只属模型性质,但现实前猛中的价格竞争、环境保护等方面,也会频繁出现类似情况。
电影囚徒剧情?
1个回答2024-02-23 11:23

该片讲述一个小镇子上6岁幼女和同伴被人绑架,负责调查案件的是一个认真负责的侦探,经由他手的案件全部破获。女孩的爸爸(休·杰克曼)是个木匠,笃信《圣经》,也是个猎鹿好手,性格冲动,他对警方不抱任何希望,决定撇开法律单独行动,一系列的机缘巧合,案件终于破

《天空的囚徒》的主要内容
1个回答2024-03-06 17:02
《天空的囚徒》内容简介:一九五七年的圣诞节,巴塞罗那阴云满天。达涅尔与费尔明刚解开《风之影》的谜题,准备回归平静的家庭生活,森贝雷父子书店此刻却又遭遇史上最大的危机:书店生意惨淡,连电费都快付不出;达涅尔发现妻子贝亚与前男友巴布罗仍有联系;与此同时,一个神秘人物造访书店,给费尔明留下一条神秘的信息:“他从死人堆里爬出,拥有开启未来的钥匙。”
达涅尔着手调查。很快,他发现了费尔明在内战时期不堪回首的往事,在那一段监狱生活中,有秘密、阴谋、欺骗、背叛,还有一笔神秘的财富。甚至,那段经历与达涅尔的母亲伊莎贝拉之死也有关联。
达涅尔是否能够信任妻子的忠贞?费尔明如何能恢复失去的身
囚徒英文怎么写
1个回答2024-05-24 05:47
  prisoner





 
“职场囚徒”与“囚徒思维”,你怎么看
1个回答2023-08-12 20:28
很多人上班,觉得是在为公司打工,混口饭吃,做多做少,做好做坏,对自己意义不大,达到要求就行了。这就是我们常说的打工者心态。
也有一些人,到一家公司上班,就把自己生命中最有精力最有学习力的一段时间投资在了公司,自然会带着投资的心态面对工作。
囚徒归来在哪里可以看到
1个回答2023-11-27 12:46

囚徒归来在笔趣阁上可以看到。《囚徒归来》情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的其他小说。

小说,是一种以刻画人物形象为中心、通过完整的故事情节和环境描写来反映社会生活的文学体裁,小说一词出自《庄子外物》。人物、情节、环境是小说的三要素。情节一般包括开端、发展、高潮、结局四部分,有的包括序幕、尾声。环境包括自然环境和社会环境。小说按照篇幅及容量可分为长篇小说、中篇小说、短篇小说和微型小说(小小说)。按照表现的内容可分为神话、仙侠、武侠、科幻、悬疑、古传、当代等小说。

热门问答