重复博弈的详细介绍ppt课件.ppt

重复博弈的详细介绍ppt课件.ppt

ID:50976193

大小:651.00 KB

页数:42页

时间:2020-03-16

重复博弈的详细介绍ppt课件.ppt_第1页
重复博弈的详细介绍ppt课件.ppt_第2页
重复博弈的详细介绍ppt课件.ppt_第3页
重复博弈的详细介绍ppt课件.ppt_第4页
重复博弈的详细介绍ppt课件.ppt_第5页
资源描述:

《重复博弈的详细介绍ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、重复博弈主要内容:一、有限次重复博弈二、无限次重复博弈与无名氏定理三、重复博弈的社会学含义1例子1-越战战场上的潜规则一名新兵刚上战场,老兵按住他:别乱开枪!新兵问:为什么?老兵对其解释:曾有一段时间,双方打得不可开交,结果大家都躲着,屎尿都撒在猫耳洞里,由于猫耳洞很潮湿,人呆在里面很难受,导致有人耳朵都发了霉,最后是谁也打不着谁,自己却活受罪。此后,便慢慢达成默契:我出来你不开枪,你出来我也不开枪。例子2一个男孩被视为傻瓜,因为每当别人拿一枚1块硬币和5分硬币让他选的时候,他总是选5分的,有一个人觉得奇怪,就问他:“为什么你不拿1块钱的?”,男孩小声回答:“假若我拿了

2、1块钱的硬币,下次他们就不会再拿钱让我选了。”威胁和承诺的重要性:以上两个例子带给我们什么启发?问题1在相互联系紧密的人际关系中,人们普遍比较注意礼节、道德,因为合作和协调对大家都有好处;但是,我们又常常见到这样的消息:在公共汽车上,两个陌生人会为一个座位争吵,为什么会发生这种事情?原因何在?问题2在“囚徒困境”这一例子中,博弈的参与人为了追求自身利益的最大化,而陷入了个人理性与集体理性的冲突中,导致最优的结果未能出现,即合作没有产生。如果我们假定博弈可以多次重复进行,结果是否会发生变化?是否会出现合作的局面?动态博弈中涉及的一个重要问题是,博弈过程中威胁和承诺如何影响

3、博弈的进程。重复博弈所关心的议题也与之相似:(1)将来可信的威胁或承诺如何影响到当前的行动?(2)在一次博弈中无法实现的均衡,在重复博弈中能否实现?一、有限次重复博弈考察下列博弈该博弈存在唯一的Nash均衡,即(U,L)。同时注意到,该博弈还存在一个高效均衡(D,R),高效均衡对应着一种合作行为。为什么高效的均衡不是纳什均衡?如何保证这一高效均衡能够实现?1,15,00,54,4UDLR12两次重复博弈的博弈树假设将上述博弈重复两次,那么第二次博弈开始时,第一次博弈的结果可视为已知。第二阶段第一阶段第一阶段运用逆推归纳法,可以发现上述重复博弈的子博弈精炼Nash均衡为:

4、在每次博弈中,参与人1都选择U,参与人2都选择L。这说明:在两次重复博弈中,高效的均衡仍无法实现。同样可证明:在n阶段重复博弈(即博弈重复n次且每次博弈开始时,前面博弈的结果都已知)中,高效的均衡同样无法实现。有限重复博弈定义定义:对于给定的阶段博弈G,令G(T)表示G重复进行T次的有限重复博弈,并且在下一次博弈开始前,所有之前博弈的进程均可被观测到。有限重复博弈的战略、子博弈与支付战略:重复博弈环境下,参与人的战略非常复杂。一般地,我们定义参与人的一个战略是在博弈的每个阶段针对之前的博弈历史而制定的行动计划;子博弈:子博弈要么仍然是重复博弈,要么是原博弈;有限重复博弈

5、的战略、子博弈与支付参与人的支付:是所有阶段博弈支付的贴现值之和,或者加权平均值。注意:在重复博弈中,阶段博弈可能是静态博弈,也可能是动态博弈,因此,重复博弈可能是完美信息重复博弈和不完美信息重复博弈。此处我们仅讨论完美信息重复博弈。假定在位者在不同的市场上有20家连锁店,进入者试图进入这些市场。如果进入者进入了每一个市场,此时博弈就变成了20次重复博弈。当进入者进入第1个市场时,在位者应该如何反应呢?猜想:杀鸡儆猴的效应连锁店悖论单阶段博弈矩阵默许斗争进入3,3-1,0不进入1,101,10进入者支付在位者纳什均衡为:在位者在每一个市场选择默许,进入者在每一个市场选择

6、进入。单阶段扩展式博弈阶段博弈的子博弈精炼纳什均衡为:在位者在每一个市场选择默许,进入者在每一个市场选择进入。重复博弈的子博弈精炼纳什均衡:在位者在每一个市场选择默许,进入者在每一个市场选择进入。定理:如果阶段博弈G有唯一的Nash均衡,则对任意有限的T,重复博弈G(T)有唯一的子博弈精炼解,即G的Nash均衡结果在每一个阶段重复进行。问题:囚徒困境中的囚徒有可能实现高效的均衡吗?考察下列博弈存在多重纳什均衡的情形单阶段Nash均衡:(L1,L2)和(R1,R2);合作均衡:(M1,M2);问题:合作均衡能否出现?现在假设博弈重复两次,可以根据以下原则构造均衡:由第一阶

7、段的结果,预测第二阶段的均衡。例如:若第一阶段出现(M1,M2)(即出现合作),则第二阶段为(R1,R2)(即“好的纳什均衡”);若第一阶段没有出现(M1,M2),则第二阶段为(L1,L2)(即“差的纳什均衡”)。冷酷战略(grimstrategies)也称触发战略;以囚徒困境为例:开始选择抵赖,而且一直选择抵赖直到有一方选择了坦白,然后永远选择坦白;这意味着:一旦哪个参与人选择了坦白,就触发了惩罚的扳机。根据上述原则,可构造如下战略:S1:第一阶段选择M1;如果第一阶段结果为(M1,M2),则下一阶段选R1;否则选择L1。S2:第一阶段

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。