博弈论的应用

博弈论的应用

ID:42007543

大小:142.00 KB

页数:34页

时间:2019-09-06

博弈论的应用_第1页
博弈论的应用_第2页
博弈论的应用_第3页
博弈论的应用_第4页
博弈论的应用_第5页
资源描述:

《博弈论的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第29章博弈论的应用本章主要研究博弈论中的4个非常重要的问题:合作问题、竞争问题、共存问题和承诺问题。一、博弈论分析的重要工具1、最优反应曲线在两个人的博弈中,假如存在一个纳什均衡,这个纳什均衡可以如下表示:假设参与人A的选择为r1,r2,…,rr,参与人B的选择为c1,c2,…,cc。对于参与人A的每一个选择r,bc(r)表示参与人B的最优反应。相应地,对于参与人B的每一个选择r,br(c)表示参与人A的最优反应。纳什均衡为:c*=bc(r),r*=br(c)——反应函数即:每个人的选择正好是对方对自己预期的选择——

2、“相互一致”。根据以上函数可以得到反应曲线。2、混合策略在以下收益矩阵,我们令参与人A选择“上”的概率为r,选择“下”的概率为1-r,同样,我们令参与人B选择“左”的概率为c,选择“右”的概率为1-c。当r和c等于0时,相应的策略为纯策略。根据收益矩阵和参与人选择的概率,可以得到参与人的期望收益。同学A同学B上下左右2,10,00,01,2根据上表,参与人A的期望收益为:2rc+(1-r)(1-c)。即:2rc+1-r-c+rc。如果r增加了△r,A的收益变化为:2c△r-△r+c△r=(3c-1)△r。即如果3c>1

3、时,A将增加r,如果3c<1,A将减少r,如果3c=1时,他对于任意的0≤r≤1无差异。组合概率参与人A的收益上,左rc2下,左(1-r)c0上,右r(1-c)0下,右(1-r)(1-c)1根据同样的方法,得到参与人B的期望受益:cr+2(1-c)(1-r)。当c增加△c时,B的收益变化为:(3r-2)△c。因此,当r>2/3时,B增加c将增加收益;当r<2/3时,B将减少c;当r=2/3时,他对于任意的0≤c≤1无差异。利用以上两个结论可以绘制参与人的最优反映曲线。如果参与人B选择c=0,那么参与人A将减少r,使r尽

4、可能小,所以r=0。因此,参与人A使r=0就是对c=0的最优反应。并且,r=0一直都是A的最优反应,直至c=1/3。当c=1/3,0≤r≤1都是A的最优反应。对于所有的c>1/3,行参与人的最优反应是r=1。•0•c1/3r1•1•A的反映曲线•2/3•B的反映曲线•••三个紫色的点为纳什均衡,两个为纯策略均衡。二、合作博弈又称协调博弈,在这类博弈中,当参与人能够协调他们之间的策略时,他们的收益就会最大。关键是如何创建这种协调机制。1、性别战假设有一个男孩和一个女孩约会看电影,但他们事先没有约好看哪一部电影,而且都忘了

5、对方的电话号码,所以没有办法协调他们的约会,只能猜测对方喜欢看那一部电影。男孩想看最新推出的动作片,女孩喜欢看文艺片,但他们都宁愿看同一部电影也不愿意放弃约会。协调博弈的特征:参与人在协调行动时获得的收益要大于单独行动时的收益。性别战的纳什均衡在以下的收益矩阵中,可以用上一节中的反应曲线来求解纳什均衡。根据上节的结论,存在三个纳什均衡:上方都选择动作片或文艺片,或者双方分别按2/3的概率选择各自偏好的影片。究竟哪种均衡会发生,要依据特殊情况而定。当参与人完全有理由相信,其中的一个均衡相对于其他的均衡更“自然”,这个均衡

6、将是最终的选择点,被称为博弈的聚点。男孩女孩动作片文艺片动作片文艺片2,10,00,01,22、囚徒困境在该博弈中,坦白是一个占优策略,但双方都抵赖(协调)是更好的选择。协调能够使囚徒获得最大化的收益。解决囚徒困境的方法之一是无限重复博弈。参与人通过将来的行动来奖励合作和惩罚不合作。另一种方式是缔结合约(协调)。双方可以签订一份合同,如果一方违约,他将支付罚金或接受其他某种方式的惩罚。但这要依赖于能够强制执行这种合同的法律体制的存在。3、保证博弈类似囚徒困境,例如美国和苏联之间的军备竞赛。两个国家都可以选择生产核导弹,

7、也可以选择都不生产。其收益矩阵如下图。该图显示:存在两个纳什均衡(不生产,不生产)和(生产,生产)。但是,(不生产,不生产)对双方都是一个较好的选择。美国苏联不生产生产不生产生产4,41,33,12,2但问题在于,任何一方都不知道对方将会做出的选择。在承诺不生产以前,每一方都想得到对方不会生产的保证。获得这种保证的方法之一是其中一方先采取行动,并接受公开的检查。这可以是一种单边的行动,但他一定要让对方相信自己的选择。类似:战国时期,皇太子做人质。4、斗鸡博弈即电影中的汽车博弈:两个年轻人分别从一条街的两头,驾车笔直地是

8、向对方。第一个转向的人会颜面尽失,但如果没有人转向,将会撞在一起。其收益矩阵如下图:存在两个纳什均衡:(不转向,转向)和(转向,不转向)。A偏好第一个,B偏好第二个。但这两个都比撞车好。它和保证博弈有所区别,双方做不相同的事情比做相同的事情好。年轻人A年轻人B转向不转向转向不转向0,0-1,11,1-2,-2在这个博弈中,每个参与

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。