博弈论(学习教学教案第四章).ppt

博弈论(学习教学教案第四章).ppt

ID:52113841

大小:266.50 KB

页数:51页

时间:2020-03-31

博弈论(学习教学教案第四章).ppt_第1页
博弈论(学习教学教案第四章).ppt_第2页
博弈论(学习教学教案第四章).ppt_第3页
博弈论(学习教学教案第四章).ppt_第4页
博弈论(学习教学教案第四章).ppt_第5页
资源描述:

《博弈论(学习教学教案第四章).ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四章重复博弈重复博弈(RepeatedGames)指基本博弈重复进行构成的博弈过程。而且重复博弈不是基本博弈的简单叠加,必须把整个重复博弈过程作为整体进行研究。重复博弈与静态博弈和动态博弈都有关系。1谢富纪2009年3月●有限次重复博弈:给定一个基本博弈G(可以是静态博弈,也可以是动态博弈),重复进行T次G,并且在每次重复G之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。1.重复博弈引论2谢富纪2009年3月●无限次重

2、复博弈:如果一个基本博弈G一直重复博弈下去,这样的重复博弈我们称为”无限次重复博弈“,记为G(∞)。●随机结束的重复博弈:一种特殊的重复博弈问题,即重复博弈的次数虽然是有限的,但重复的次数或博弈结束的时间却是不确定的。1.重复博弈引论3谢富纪2009年3月1.重复博弈引论虽然重复博弈每次重复的条件、规则、内容都相同,但由于有长期利益的存在,因此各博弈方在当前阶段要考虑到后面阶段不能引起其他博弈方的对抗、报复或恶性竞争,即不能像一次静态博弈中那样毫不顾及其他博弈方的利益。这样重复博弈就有了在一次性博弈中往往不可能实现的合作的可能性,实现了比一次

3、性博弈更有效率的均衡。这就是重复博弈与构成这些重复博弈的一次性博弈之间的重要区别。4谢富纪2009年3月1.重复博弈引论可信性同样是一个重要的概念,即子博弈完美性仍然是判断均衡是否稳定可靠的重要依据。由于重复博弈中有长期利益对短期行为的制约作用,使一些在一次性博弈中不可信的威胁或诺言在重复博弈中成为可信的,从而使博弈的均衡、结果会出现更多的可能性。5谢富纪2009年3月●重复博弈的策略:重复博弈中每个博弈方在每个阶段都必须行为,博弈方的一个策略就是在每个阶段(即每次重复),针对每种情况(以前阶段的结果)如何行为的计划。博弈方的一个策略意味着每

4、次轮到其行为时针对每种可能情况如何选择的完整计划。●子博弈:从某个阶段(不包括第一阶段)开始,包括此后所有阶段的重复博弈部分。●与子博弈有关的概念和结论,包括子博弈完美纳什均衡,以逆推归纳法为核心的子博弈完美纳什均衡分析及相关结论,都可以推广到重复博弈中。1.重复博弈引论6谢富纪2009年3月●重复博弈的路径:每个阶段的阶段博弈结果(原博弈的一个策略组合)依次连接而成,即由每个博弈方的行为组合串联而成。●重复博弈的得益:重复博弈每阶段都有一组得益,因此重复博弈中各博弈方的得益应该是他们每阶段得益相加的总得益。●重复博弈的平均得益:总得益除以博

5、弈次数。1.重复博弈引论7谢富纪2009年3月●考虑时间价值的某博弈方重复博弈总得益现值为(有限次博弈)π=π1+δπ2+δ2π3+…..+δT-1πT=∑δt-1πt●无限次重复博弈的总得益现值为:π=π1+δπ2+δ2π3+…..=∑δt-1πt其中T为重复博弈次数;δ是贴现系数;πT为第T次的得益。1.重复博弈引论8谢富纪2009年3月平均得益:如果一常数作为重复博弈(有限次重复或无限次重复)各个阶段的得益,能产生与得益序列π1,π2,……相同的现在值,则称为π1,π2,……的“平均得益”。无限次重复博弈必须考虑贴现问题。1.重复博弈引

6、论由得9谢富纪2009年3月随机结束的重复博弈的期望得益现值为:π=π1+π2(1-p)/(1+r)+π3(1-p)2/(1+r)2+……=∑πt(1-P)t-1/(1+r)t-1=∑δt-1πtp为停止重复的概率;r为利率。这样就可以把δ与纯粹考虑时间价值的贴现率统一起来。1.重复博弈引论10谢富纪2009年3月2.有限次重复博弈两人零和博弈的有限次重复博弈猜硬币是一个两人零和静态博弈,双方根本不可能存在合作的可能。因为每次重复的结果都是一赢一输,得益相加得零。每个博弈方唯一正确的策略就是每次重复时都采用一次性博弈的纳什均衡策略。即各以0.

7、5的概率随机选正面和反面的混合策略,重复博弈的结果是双方的平均得益和期望得益都为零。实际上,所有以零和博弈为原博弈的的有限次重复博弈与猜硬币博弈的有限次重复一样,博弈方的正确策略是重复一次性博弈中的纳什均衡。11谢富纪2009年3月有唯一纯策略纳什均衡博弈的有限次重复博弈有限次重复博弈的囚徒困境博弈,可以理解成警察给两人两次交代的机会。2.有限次重复博弈囚徒2坦白不坦白囚徒1坦白-5,-50,-8不坦白-8,0-1,-112谢富纪2009年3月因为重复博弈全过程是一种动态博弈过程,从第二阶段开始。此前的博弈已是既成的事实,而在此后又没有任何的

8、后继阶段,因此实现本阶段最大利益是两博弈方在该阶段的唯一原则。结果是(坦白,坦白),双方得益为(-5,-5)。再看第一阶段。2.有限次重复博弈13谢富纪2009年3

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。