囚徒困境研究专题

囚徒困境研究专题

ID:19354467

大小:30.72 KB

页数:9页

时间:2018-10-01

囚徒困境研究专题_第1页
囚徒困境研究专题_第2页
囚徒困境研究专题_第3页
囚徒困境研究专题_第4页
囚徒困境研究专题_第5页
资源描述:

《囚徒困境研究专题》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第五章囚徒困境研究专题一、囚徒困境为什么被关注?囚徒困境是指如下的博弈甲乙不合作合作不合作2*,2*1,4合作4,13,3之所以囚徒困境被广泛的关注,不仅仅在于它由强大的解释力,如它可以解释企业竞争,应试教育困境,集体劳动悲剧等等,更重要的在于人们从中看到一个深刻的问题:个体理性与集体理性的冲突。哈丁的公共地悲剧(1968)如何破解?重复进行!什么是重复博弈?重复博弈指的是参与人之间进行多次相同的博弈,每个人所得收益为每次博弈的收益之和。注意:(1)这里的收益之和应该考虑贴现率。(2)重复博弈分为有限次重复和无限次重复有限次重复囚徒困境博弈的特征

2、:(1)完全但不完美信息,(2)重复。有限次重复囚徒困境的解,每步都“不合作”为纳什均衡。二、无限次重复囚徒困境中的策略两个参与人无限次地重复囚徒困境,每个人的收益为每次博弈所获收益之和。在这样的博弈中因无最后一步,我们无法通过逆向归纳法来求解它。无限次重复囚徒困境博弈及其各种策略分析:触发策略:参与人开始采取合作行动,若发现对方在某步采取“背叛”行动,参与人以后都采取背叛行动。“永远合作”:在每个囚徒困境博弈中均采取“合作”策略二无论对方采取什么策略。一旦采取这个策略,对方的最优策略是每步均采取“背叛”策略。在重复囚徒困境博弈中人们通过策略的变

3、化或偏离进行学习的。一旦人们的合作行动的偏离——无论这样的偏离是有意还是无意的——得到额外的好处、对方遭受损失,同时这样的偏移没有被“惩罚”,人们将尝试性的进一步偏移。我们看到,若某个参与人在重复囚徒困境中采取永远“合作”,其结果是对方将通过一步步偏移,直至永远偏离。因此,理性人应该知道上述这个分析的结论,他不会采取这个永远合作策略。“永远背叛”策略:在对方第一步采取合作并假定对方以后采取“一报还一报”的情况下,第一步或者某一步主动采取“背叛”的收益为:U=4+2δ+2δ2+……=4+2δ/(1-δ)U’=3+3δ+3δ2+……=3+3δ/(1-

4、δ)U≥U’δ≤1/2.5.1-9,,services,andmakethecitymoreattractive,strengtheningpublictransportinvestment,establishedasthebackboneoftheurbanrailtransitmulti-level,multi-functionalpublictransportsystem,thusprotectingtheregionalpositionandachieve这里,δ反映的是未来的现实价值,或者说长期利益与短期利益。人们在教学这样的博弈以及其

5、他博弈中都会在短期利益与长期利益之间进行权衡。“一报还一报”策略:第一步合作,之后紧跟对方上一步策略。一个统一的策略模型:“n报还m报”,这里n与m取值为0到无穷大。一个成功的策略含有:“友善”:第一步“合作”。“报复”:面对他人的“背叛”要有惩罚。“宽容”:若他人认识到错误、从“背叛”到“合作”,参与人要给他人机会。这里的“报复”与“宽容”反映的是对他人的策略变化要有相应的变化,不同的人“报复”与“宽容”的程度能够不同。能否通过先“背叛”而获得高分?一旦背叛会面临对方的惩罚,因此能否得高分取决于他人的策略。需要实验研究。计算机模拟。这里的策略分

6、析针对的是固定的两个人之间进行固定重复囚徒困境博弈。第一,如果两个人进行多个囚徒困境博弈,如何进行这样的博弈?第二,如果参与人可更换?如何进行?三、两个参与人之间进行多个囚徒困境博弈。我们考虑两个人甲和乙进行两个重复性的囚徒困境博弈,这两个囚徒困境博弈的进行存在先后。怎样的策略才能获得最大的收益?假定甲乙进行两个“不同的”重复的囚徒困境博弈A和B。要说明的是,囚徒困境是一类博弈的模型,这里甲乙所进行的所谓不同的囚徒困境博弈,指的是两个这样的博弈。此时存在很多策略,这里列出四种:第一,“极度冷酷策略”。在A囚徒困境博弈的某个阶段,甲采取“合作”策略

7、,而乙采取了“不合作”策略,甲的收益降低,而乙的收益增加。甲观察到了乙的不合作策略,甲如何行动呢?甲可采取“冷酷策略”,即在与乙的该博弈中甲永远采取“不合作”策略。甲也可采取“一报还一报”策略,即在下一步甲也将采取“不合作”,在以后的博弈阶段中,甲采取何种行动,取决于乙是否改正……然而,对于甲,这是可能的,当乙采取了“不合作”策略,甲在该博弈的余下的阶段中,将永远采取“不合作”行动,并且在与乙的“其他的囚徒困境重复博弈”中也将采取“不合作”行动。甲此时的这种策略是极端的“冷酷”,他对乙的态度是极度的不宽容。某个参与人与他人进行多个重复囚徒困境博弈

8、中,因对方在某个博弈的某个阶段采取了“不合作”,他在与对方的该博弈中将永远采取“不合作”,并且在与该对方的其他囚徒困境博弈中也毫无例外地

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。