理论发展混合战略和均衡的存在性.ppt

理论发展混合战略和均衡的存在性.ppt

ID:56530831

大小:301.50 KB

页数:48页

时间:2020-06-27

理论发展混合战略和均衡的存在性.ppt_第1页
理论发展混合战略和均衡的存在性.ppt_第2页
理论发展混合战略和均衡的存在性.ppt_第3页
理论发展混合战略和均衡的存在性.ppt_第4页
理论发展混合战略和均衡的存在性.ppt_第5页
资源描述:

《理论发展混合战略和均衡的存在性.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、1.3理论发展:混合战略和均衡的存在性1.3.A混合战略根据纳什均衡的定义,下图所示“猜硬币”的博弈是不存在纳什均衡的。为理解矩阵表中所列参与者各自的收益,设想每一参与人拿有一枚硬币,并必须选择是出正面向上还是背面向上。若两枚硬币是一致的(即全部正面向上或全部背面向上),则参与人2赢走参与人1的硬币;如果两枚硬币不一致(一正一反),参与人1赢得参与人2的硬币。在此博弈中,没有一组战略能够满足纳什均衡的条件。猜硬币博弈一个非常突出的特点是每个参与者都试图能先猜中对方的战略。这一类博弈在扑克、战争等其他环境中也经常会发生。在用扑克牌

2、赌博的博弈中,类似的问题是如何决定使诈的次数:如果大家都知道参与者i是从来不使诈的,那么任何时候当i下很高的赌注时他的对手就会认输,但这又使得i偶然使诈会有利可图;另一方面,使诈次数过多亦非上策。与之相似,在战争中,假设进攻方可能在两个攻击点(或两条进攻路线,比如“陆路或水路”)中选择其一,防御方可以抵御来自任一方向的攻击,但也只在它正确预测到进攻路线的前提下。在博弈中,一旦每个参与者都竭力猜侧其他参与者的战略选择,就不存在前面所定义的纳什均衡,因为这时参与者的最优行为是不确定的,而博弈的结果必然要包含这种不确定性。现在引入混合

3、战略的概念,我们可以将其解释为一个参与者对其他参与者行为的不确定性。规范地表述,参与者i的一个混合战略是在其战略空间Si中(一些或全部)战略的概率分布,此后我们称Si中的战略为i的纯战略(purestrategies)。对完全信息同时行动博弈来说,一个参与者的纯战略就是他可以选择的不同行动。例如在猜硬币博弈中,Si内含有两个纯战略,分别为正面和背面,这时参与者i的一个混合战略为概率分布(q,1-q),其中q为出正面向上的概率,1一q为出背面向上的概率,且0≤q≤1。混合战略(0,1)表示参与者的一个纯战略,即只出背面向上。类似地

4、,混合战略(1,0)表示只出正面向上的纯战略。作为混合战略的第二个例子,请回顾图1.1.1所示博弈,参与者2有三个纯战略:左、中、右,这时他的一个混合战略为概率分布(q,r,1-q-r),其中q表示出左的概率,r表示出中的概率,1-q-r表示出右的概率.和前面相同,0≤q≤1,0≤r≤1,0≤q+r≤1。在此博弈中,混合战略(1/3,1/3,1/3)表示参与者出左、中、右的概率相同,而(1/2,1/2,0)表示出左、中的概率相同,但绝不可能选择出右。和在所有情况下一样,参与者的一个纯战略只是混合战略的一种特例,例如参与者2只出左

5、的纯战略可表示为混合战略(1,0,0)。更为一般地,假设参与者i有K个纯战略:Si={si1,...,sik},则参与者i的一个混合战略是一个概率分布(pi1,...,pik),其中pik表示对所有k=1,...,K,参与者i选择战略sik的概率。由于pik是一个概率,对所有k=1,...,k,有0≤pik≤1且pi1+...+pik=1。我们用pi表示基于Si的任意一个混合战略,其中包含了选择每一个纯战略的概率,正如我们用si表示Si内任意一个纯战略。定义对标准式博弈G={S1,...,Sn;u1,...,un},假设Si={

6、si1,...,sik},那么,参与者i的一个混合战略为概率分布pi=(pi1,...,pik),其中对所有k=1,...,k,0≤pik≤1,且pi1+...+pik=1。对于严格劣战略,前面曾讲到,如果战略si为严格劣战略,那么参与者i不可能作出这样的推断(针对其他参与者的战略选择):他的最优反应战略会是si。如果我们引入混合战略,就可证明其逆命题:如果(针对其他参与者的战略选择)参与者i都不可能作出这样的推断:其战略si会成为最优反应战略,则一定存在另一战略严格优于si。图1.3.1和图1.3.2所示博弈说明了,如果我们只

7、讨论纯战略,这一逆命题是不成立的。图1.3.1显示出,一个给定的纯战略可能会严格劣于一个混合战略,即使这个纯战略并不严格劣于其他任何一个纯战略。在这一博弈中,针对参与人1对参与人2可能行动所作出的任何推断(q,1一q),1的最优反应要么是T(在q=1/2时),要么是M(在q=1/2时),但不会是B,虽然T或M都不严格优于B。这里的关键在于B是T和M的一个混合战略的严格劣战略:如果参与者1以1/2的概率出T,以l/2的概率出M,则其期望收益为3/2,不管2将会选择什么(纯的或混合的)战略,3/2都大于选择B时将得到的收益1。这个例

8、子说明了在“寻找另外一个严格优于的战略”时,混合战略所起的作用。图1.3.2说明了一个给定的纯战略可以是针对一个混合战略的最优反应,即使这一纯战略并不是对方任何一个纯战略的最优反应。在此博弈中,对参与人2的纯战略L和R来说,参与人1的最优反应都不是B,但B却是针

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。