博弈论知识考点

博弈论知识考点

ID:39688099

大小:2.33 MB

页数:6页

时间:2019-07-09

博弈论知识考点_第1页
博弈论知识考点_第2页
博弈论知识考点_第3页
博弈论知识考点_第4页
博弈论知识考点_第5页
资源描述:

《博弈论知识考点》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、博弈是人们的行为之间的交互作用博弈论的含义博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。策略性环境是指,每一个人进行的决策和采取的行动都会对其他人产生影响;策略性决策和策略性行动是指,每个人要根据其他人的可能反应来决定自己的决策和行动。在所有社会,人们经常互动。有时,互动是合作,其他的时候,互动是竞争。在这两种情况下,都可以用一个术语,即相互依赖性来表示一个人的行为对另外一个人的福利造成的影响。相互依赖的情形可称为策略环境。因为人们为了确定所采取的最优行动,必须考虑他周围的其他

2、人会怎样选择行动。策略对于社会的运行来说,是非常基本的。我们要学会了解在策略环境下,人们实际上是如何采取行动的,以及他们应该怎样采取行动。这种系统的研究形成了策略互动的理论。博弈论三要素:博弈的三个基本要素三个基本要素,即参与人、参与人的策略和参与人的支付。所谓参与人(或称局中人),就是在博弈中进行决策的个体;所谓参与人的策略,指的是一项规则,根据该规则,参与人在博弈的每一时点上选择如何行动;所谓参与人的支付是指,在所有参与人都选择了各自的策略且博弈已经完成之后,参与人获得的效用(或期望效用)。3.

3、博弈的简单分类根据参与人的数量,可以分为二人博弈和多人博弈;根据参与人的支付情况,可分为零和博弈和非零和博弈;根据参与人拥有的策略的数量多少,可分为有限博弈和无限博弈;根据参与人在实施策略上是否有时间的先后,可分为同时博弈和序贯博弈。一些概念:局中人或参与者(Players)规则(rules):规定博弈各方的行动顺序、方式、以及最终的结果等。策略(Strategy):一整套的行动方案,规定了各种情况下的行动。比如:敌进我退,敌退我追,敌驻我扰,敌疲我打。相机策略(contingentstrategy

4、):仅在不确定事件发生时才会采取的策略。如:人不犯我,我不犯人;人若犯我,我必犯人。行动:局中人在特定条件下的行为支付(Pay-off):博弈结束时,各方得到的收益。策略均衡:参与者之间稳定的、可预测的互动行为模式,就是策略均衡。上策均衡与纳什均衡上策均衡:我所做的是不管你做什么我所能做的最好的你所做的是不管我做什么你所能做的最好的所谓上策,是指这样一种策略,即不管对手采取什么策略,这种策略都是最优的。而当对局者选择的都是上策的时候,这种均衡叫做上策均衡。NASH均衡:我所做的是给定你所做的我所能做

5、的最好的你所做的是给定我所做的你所能做的最好的纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。在一个纳什均衡里,任何一个参与者都不会改变自己的策略,如果其他参与者不改变策略。上策均衡与纳什均衡的区别:⑴上策均衡是指不管你选择什么策略,我所选择的是最好的;不管我选择什么策略,你所选择的是最好的。⑵纳什均衡是指给定你的策略,我所选择的是最好的;给定我的策略,你所选择的是最好的。⑶上策均衡是纳什均衡的一种特殊情况,但纳什均衡却不一定是上策均衡。求纯策略博弈的纳什均衡街解的方法混合策略

6、均衡的情侣博弈,根据支付矩阵计算出博弈双方的期望得益分析该博弈的纳什均衡的概率分布寻找混合策略纳什均衡的思路令各博弈方随机选择纯策略的概率分布,满足使其他博弈方采用不同策略的期望得益相同,从而计算出各个博弈方随机选择各纯策略的概率。在猜硬币博弈中,设盖硬币方出正面的概率为p,出反面的概率为1-p。则猜硬币方猜正面的期望得益为p·1+(1-p)·(-1)=2p-1,猜反面的期望得益是p·(-1)+(1-p)·1=1-2p,令二者相等,得p=1/2。盖硬币方的混合策略是以(1/2,1/2)的概率随机选择

7、正面和反面。类似的,可以计算出猜硬币方的混合策略。.期望支付运用两个参与人的混合策略组合,可以分别表示出两个参与人得到的支付。博弈树1.博弈树的起点“起点”又叫做“初始决策点”,通常只有一个。起点是博弈树的“根”,是序贯博弈开始的地方,是博弈的最先行动者进行决策的地方。2.博弈树的线段从初始决策点出发,向右伸展两条线段,分别表示竞争者可以采取的两个行动或策略。3.博弈树的中间点中间点又叫做“中间决策点”,通常至少应有两个。通常在这些中间决策点的旁边标上另一参与人,表示中间点是另一参与人做决策的地方。

8、博弈树的终点第一,终点不是决策点终点是博弈结束的地方。与起点和中间点不同,终点不是决策点:既不是初始决策点,也不是中间决策点。因此,终点不属于任何的参与人,终点的旁边没有标注任何的参与人。第二,终点的两层含义一是代表博弈的一个策略组合——从起点开始导向某个终点的所有线段按先后秩序排列的一个组合。二是代表与某一个策略组合相对应的一个支付组合——在每一个终点的旁边,有一对用圆括号围住的数字,其中的第一个数字是先行动者的支付,第二个数字是后行动者的支付。逆向归纳法求解子博弈

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。