博弈论第五章1

博弈论第五章1

ID:44361775

大小:482.50 KB

页数:40页

时间:2019-10-21

博弈论第五章1_第1页
博弈论第五章1_第2页
博弈论第五章1_第3页
博弈论第五章1_第4页
博弈论第五章1_第5页
资源描述:

《博弈论第五章1》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第五章完全信息动态博弈(二):重复博弈引论为何研究重复博弈?经济中的长期关系人们的预见性未来利益对当前行为的制约长期合同、回头客、长客和一次性买卖的区别有无确定的结束时间人们之间的长期关系与短期关系之间有重要的性质差别,人们在对待与其有长期关系的人与对待那些以后不再交往的人可能会有非常不同的行为。短期难以形成某种默契或合作关系,而长期可以通过报复、制裁的威胁来相互约束各方的行动。引论引论本章介绍基本博弈重复进行构成的重复博弈。虽然形式上是基本博弈的重复进行,但重复博弈中博弈方的行为和博弈结果却不一定是基本博弈的简单重复,因为博弈方对于博弈会重复进行的意识,会使他们

2、对利益的判断发生变化,从而使他们在重复博弈过程中的行为选择受到影响。这意味着不能把重复博弈当作基本博弈的简单叠加,必须把整个重复博弈过程作为整体进行研究。阶段博弈之间没有“物质上”的联系,即前一阶段的博弈不改变后一阶段博弈的结构;所有博弈方都观测到博弈过去的历史;博弈方的总支付是所有阶段博弈支付的贴现值之和或加权平均值。贴现因子:下一期的一单位支付在这一期的价值。注意:在每个阶段,参与人可同时行动,也可不同时行动。重复博弈的基本特征因为其他参与人过去的历史总是可以观测到的,因此,一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史,因此,参与人在

3、重复博弈中的战略空间远远大于和复杂于每一阶段的战略空间,这意味着,重复博弈可能带来一些“额外”的均衡结果。影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。博弈重复的次数的重要性来源于参与人在短期利益和长远利益之间的权衡。信息的完备性:当一个参与人的支付函数不为其他参与人知道时,该参与人可能有积极性建立一个“好”的声誉以换取长远利益。重复博弈和无名氏定理有限次重复博弈:连锁店悖论无限次重复博弈和无名氏定理相关概念相关概念相关概念相关概念一、有限次重复博弈有限次重复博弈令G为阶段性博弈,G(T)是G重复T次的重复博弈(T<)如果G有唯一的纯策略纳什均衡

4、解,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次,各博弈方在G(T)中的总得益为在G中得益的T倍,平均每阶段得益等于原博弈G中的得益。如囚犯困境。在位者进入者不进入进入默许斗争(0,300)(40,50)(-10,0)策略式Nash均衡为(进入,默许)和(不进入,斗争)但后者不是子博弈完美Nash均衡。进入40,50-10,0不进入0,3000,300进入者默许斗争在位者有限次重复博弈:连锁店悖论有限次重复博弈:连锁店悖论假定同样的市场有20个(可以理解为在位者有20个连锁店),进入者每次进人一个市场,博弈就成了20次的重复博弈。人们

5、也许会猜想,尽管从一个市场看,在位者的最优选择是默许,但因为有20个市场要保护,为了防止进入者进入其他19个市场,应该选择斗争,但子博弈完美的结果为进入者在每一市场选择进入,而在位者总是选择默许。连锁店悖论—市场进入博弈默许斗争进入40,50-10,0不进入0,3000,300进入者支付在位者3,30,4利他4,01,1利己利他利己甲乙支付n次重复博弈讨论“信息完备”是重复博弈的一个必要条件,事实证明,如果局中人的博弈环境存在不完备信息,或者存在不确定性,类似于“连锁店悖论”这样的问题多半会消失。假定连锁店有高成本、低成本两种情况,就单期博弈看,面对新厂商进入,高

6、成本厂商最佳反应为容忍,低成本厂商最佳反应为斗争,那么高成本厂商在博弈的前期阶段选择斗争,仍是可信的威胁。有限次重复博弈的民间定理个体理性得益:不管其它博弈方的行为如何,一博弈方在某个博弈中只要自己采取某种特定的策略,最低限度保证能获得的得益。可实现得益:博弈中所有纯策略组合得益的加权平均数组。定理:设原博弈的一次性博弈有均衡得益数组优于w,那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们。注:w表示最差均衡得益数组.0,04,11,43,3厂商1厂商2BAAB两市场博弈厂商2得益厂商1得益(1,

7、4)(3,3)(1,1)(4,1)w=(1.1)二、无限次重复博弈与无名氏定理无限次重复博弈假设囚徒困境是一个阶段性博弈,并且是无限次重复博弈,那么任一个囚徒选择抵赖的条件是:0+(-6)+2(-6)+…-1+(-1)+2(-1)+…(为贴现因子)或者-6/(1-)-1/(1-),即1/6(即局中人具有足够的耐心),(抵赖、抵赖)(冷酷战略)是无限次囚徒博弈的一个子博弈精炼纳什均衡.冷酷战略(1)开始选择抵赖;(2)选择抵赖一直到有一方选择了坦白,然后永远选择坦白。无限次重复博弈使其走出了囚徒困境,背后的原因是:如果博弈重复无穷次而且每个人

8、有足够的耐

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。