混合策略纳什均衡

混合策略纳什均衡

ID:5410761

大小:1.35 MB

页数:35页

时间:2017-11-11

混合策略纳什均衡_第1页
混合策略纳什均衡_第2页
混合策略纳什均衡_第3页
混合策略纳什均衡_第4页
混合策略纳什均衡_第5页
资源描述:

《混合策略纳什均衡》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二节混合策略纳什均衡的求解方法二、支付最大化法例:扑克牌对色游戏(p77)无纯策略NE给定混合策略p甲=(r,1-r);p乙=(q,1-q)π甲(p甲,p乙)=r[q(-1)+(1-q)1]+(1-r)[q1+(1-q)(-1)]=2r(1-2q)+(2q-1)π乙(p甲,p乙)=q[r1+(1-r)(-1)]+(1-q)[r(-1)+(1-r)1]=2q(2r-1)-(2r-1)混合策略纳什均衡是甲在策略空间{红,黑}上以概率分布p甲*=(1/2,1/2)进行选择,乙也在策略空间{红,黑}上以概率p乙*=(1/2,1/2)进行选择解:Maxπ甲(p甲,p乙)r

2、q*=1/2f.o.c.1-2q=0Maxπ乙(p甲,p乙)qr*=1/2f.o.c.2r-1=0第二节混合策略纳什均衡的求解方法二、反应对应法例:扑克牌对色游戏(p77)无纯策略NE给定混合策略p甲=(r,1-r);p乙=(q,1-q)π甲(p甲,p乙)=2r(1-2q)+(2q-1)整理原则:一项含r,一项不含rπ乙(p甲,p乙)=2q(2r-1)-(2r-1)整理原则:一项含q,一项不含q按照NE的条件,一个策略组合如过是一个NE,那么其中的每一个策略都是参与人针对其他参与人策略组合的最优反应,在纯策略NE中,这个“最优反应”可能是一个具体的纯策略(离散情形),也可能是一个

3、反应函数(reactionfunction,如连续情形、古诺模型)。而在一个混合策略NE中,这个“最优反应”将是一个概率或很多个概率——被称为“反应对应”(reactioncorrespondence)第二节混合策略纳什均衡的求解方法二、反应对应法例:扑克牌对色游戏(p77)先看甲的最优反应,记为r*=R(q):观察π甲(p甲,p乙)=2r(1-2q)+(2q-1)rq01(红)1(红)1/21/2r*=R(q)反应对应曲线第二节混合策略纳什均衡的求解方法二、反应对应法例:扑克牌对色游戏(p77)再看乙的最优反应,记为q*=R(r):观察π乙(p甲,p乙)=2q(2r-1)-(2

4、r-1)rq01(红)1(红)1/21/2q*=R(r)反应对应曲线第二节混合策略纳什均衡的求解方法二、反应对应法例:扑克牌对色游戏(p77)作为NE,各个参与人的反应应该同时为最优,只有两个反应对应的交点满足NE:r*=1/2,q*=1/2NE支付为:π甲(p甲,p乙)=2r(1-2q)+(2q-1)=0π乙(p甲,p乙)=2q(2r-1)-(2r-1)=0rq01(红)1(红)1/21/2q*=R(r)r*=R(q)第二节混合策略纳什均衡的求解方法二、反应对应法作业:社会福利博弈。使用反应对应法找到纳什均衡。流浪汉寻找工作游荡救济政府不救济3,2-1,3-1,10,0第三节寻

5、找多重纳什均衡例:情侣博弈两个(多个)纯策略纳什均衡问题:纳什均衡找完了吗?有无混合策略纳什均衡?一、支付最大化法给定混合策略p陈明=(r,1-r);p钟信=(q,1-q)Maxπ陈明(p陈明,p钟信)=r[3q+(1-q)]+(1-r)[0+2(1-q)]=r(4q-1)+2(1-q)Maxπ钟信(p陈明,p钟信)=q(2r+0)+(1-q)[r+3(1-r)]=q(4r-3)+(3-2r)NE:(r*,q*)=(3/4,1/4)二、反应对应法rq第三节寻找多重纳什均衡二、反应对应法:情侣博弈先看陈明的最优反应,记为r*=R(q):π陈明(p陈明,p钟信)=r(4q-1)+2(

6、1-q)rq01(钟信德语)1(陈明德语)1/4r*=R(q)第三节寻找多重纳什均衡二、反应对应法:情侣博弈再看钟信的最优反应,记为q*=R(r):π钟信(p陈明,p钟信)=q(4r-3)+(3-2r)rq01(钟信德语)1(陈明德语)1/4q*=R(r)3/4第三节寻找多重纳什均衡二、反应对应法:情侣博弈反应对应曲线有三个交点:三个NE:r*=0,q*=0纯策略(确定性)r*=3/4,q*=1/4混合策略(不确定性)r*=1,q*=1纯策略(确定性)rq01(钟信德语)1(陈明德语)1/43/4r*=R(q)q*=R(r)第三节寻找多重纳什均衡二、反应对应法:情侣博弈支付的帕累

7、托优势:初步印象π陈明=r(4q-1)+2(1-q),π钟信=q(4r-3)+(3-2r)r*=0,q*=0纯策略(确定性)双方NE支付:π陈明*=3,π钟信*=2r*=3/4,q*=1/4混合策略(不确定性)双方NE支付:π陈明*=3/2,π钟信*=3/2r*=1,q*=1纯策略(确定性)双方NE支付:π陈明*=2,π钟信*=3纯策略纳什均衡比混合策略纳什均衡具有支付优势,这称为帕累托优势如果博弈同时存在纯策略纳什均衡和混合策略纳什均衡,前者往往得到优先考虑第三节寻找多重纳什均

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。