混合策略和混合策略纳什均衡

混合策略和混合策略纳什均衡

ID:44637269

大小:78.50 KB

页数:6页

时间:2019-10-24

混合策略和混合策略纳什均衡_第1页
混合策略和混合策略纳什均衡_第2页
混合策略和混合策略纳什均衡_第3页
混合策略和混合策略纳什均衡_第4页
混合策略和混合策略纳什均衡_第5页
资源描述:

《混合策略和混合策略纳什均衡》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、混合策略和混合策略纳什均衡这种博弈方以一定的概率分布在可选策略屮随机选择的策略选择方式,被称为混合策略(MixedStrategies)。定义:在博弈G二{»…,S”m,…,冷}中,博弈方i的策略空间为S产治,…如},则博弈方i以概率分布□={%,•・•,%}随机在其k个可选策略中选择的“策略”,称为一个“混合策略”,其中0WpijW1对j=l,・・・,k都成立,且pil+・・・+pik=l。1、混合策略和严格下策反复消去法(1)任何博弈方都不会采用任何严格下策,不管它们是纯策略还是混合策略;(2)

2、严格下策反复消去法不会消去任何纳什均衡,包扌舌纯策略纳什均衡和混合策略纳什均衡;(3)如果经过反复消去后留下的策略组合是唯一的,那么一定是纳什均衡。练习2:求取“剪刀、石头、布”博弈的策略均衡解甲乙剪刀石头布剪刀0,0-1,11,-1石头1,-10,0-1,1布-1,11,-10,0该博弈无纯策略解,但可求取混合策略解。设甲选择三种策略的概率分别为qi,q2和l-qi-q2,乙选择其三种策略的概率分别为pl,P2和—p】一p2给定乙的选择(概率P—定),甲方选择三种策略的支付如下:JTll=OXpi

3、+(—l)Xp2+lX(l—Pl—P2)=l—Pl—2p2JT12=lxp1+0Xp2+(—1)X(1—pi—p2)=—1+2pi+p27113=(—l)Xp1+lxp2+Ox(l—p!—p2)=—pi+p2要存在混合策略均衡,则以上三种策略选择的支付应相等,即冇:]_Pl_2p2二_p]+p2■l+2pi+p2二_P1+P2所以,pi+p2=l/3同理,给定甲方的选择(概率q—定),可有:312i=0Xq]+(—l)Xq2+lX(l—q!—q2)=l—qj—2q2ji22=lxqj+OXq2+(—

4、1)x(1—qj—q2)=—1+2q]+q?n23=(—1)xqi+1xq2+Ox(l—qj—q2)=—qi+q?同样可求得:q!=q2=l/3因此,该博弈的混合策略均衡解为(1/3,1/3,1/3)练习3:试分析斗鸡博弈的混合策略均衡甲乙进退进-1,-12,0退0,21,1该博弈的两个纯策略解分别为:(2,0)和(0,2)还可求岀其混合策略解。设甲选择“进,退”的机率分别为q,1-q,乙为p,1-p给定p,甲方的支付为:ji甲1二一p+2(l—p)71甲2=1—p混合策略解的存在要求兀甲尸只甲2,

5、故可求出p=l/2给定q,乙方的支付为:兀乙1=—q+2(l—q)兀乙2=]_q因此,该博弈的混合策略均衡解为(1/2,1/2)2、混合策略反应函数反应函数即一博弈方对另一博弈方每种可能的决策内容的最佳反应决策构成的函数。在纯策略范畴内,反应函数是各博弈方选择的纯策略对其他博弈方纯策略的反。在混合策略范畴内,博弈方的决策内容为选择概率分布,反应函数就是一方对另一方的概率分布的反应,同样也是一定的概率分布。练习4:在“钱币配对”博弈中找出不动点,并画出其最适反应甲乙正面p反面1—p正面q1,-1-1,

6、1反面i—q-1,11,-1一该博弈无纯策略解,但可求出混合策略解。甲乙各自的策略选择概率如图所O给定p,可求岀:71甲l=p—(1—p)兀甲2=一P+(l一P)因混合策略解存在,要求兀甲1=兀甲2故而可以算出:p=l/2给定q,也可求:兀乙i=-q+(l—q)兀乙2=q_(l_q)也可算出:q=l/2据此,可以価出如下图示的最适反应,并求得不动点。p*=p(q)q*=q(p)(p*,q*)——411/20p=l,ifq1/2q=0,ifp

7、[0,l],ifpl/2;l,ifp>l/2根据上述分析,该博弈的不动点为(1/2,1/2)练习5:求出性别战博弈的混合策略均衡和不动点表1.1性别战博弈男女足球q芭蕾1-q足球P2,10,0芭蕾1—P0,01,2解:首先,求出该博弈的混合策略均衡。给定(q,l—q),男子的报酬是2q和1—q若2q=l—q,即有q=l/3,则两策略的报酬和同。对男了来说,若qvl/3,2ql/3,则p*=l是最适反应。给定(p,l—p),

8、女子的报酬是p和2(1—p)若p=2(l—p),即有p=2/3,贝!J两策略的报酬相同。对女了来说,若pv2/3,p<2(l—p),贝!Jq*=0是最适反应;p=2/3,则q—(0,1)是最适反应;p>2/3,则q*=l是最适反应。从上面分析,可以得到男子和女子的最适反应函数,W:p*=p*(q),q*二q*(p)得到三个均衡(p*,q*)=(0,0),(2/3,1/3),(1,1)其次,图解该博弈的不动点。Pp*(q)12/3()*,□*)q*(p)01/31q上列

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。