博弈论练习题 第一组 参考答案

博弈论练习题 第一组 参考答案

ID:33927291

大小:144.74 KB

页数:5页

时间:2019-02-28

博弈论练习题 第一组 参考答案_第1页
博弈论练习题 第一组 参考答案_第2页
博弈论练习题 第一组 参考答案_第3页
博弈论练习题 第一组 参考答案_第4页
博弈论练习题 第一组 参考答案_第5页
资源描述:

《博弈论练习题 第一组 参考答案》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、博弈论练习题第一组第一章囚徒困境与经典矩阵博弈习题集(2011年9月30日)1.(单项选择)甲乙两人各在纸片上写下“合作”或“斗争”两词,然后双方同时翻开纸片。如果两人都写“合作”,每人各得100元;若两人都写“斗争”,两人什么也得不到;若一人写“斗争”,另一人写“合作”,则:“合作”者得S,“斗争”者得T。要使“斗争”为占优策略,S和T必须是()。A.S+T>200B.S100C.S<0,T>100D.以上都不是解答,答案为C,写出这个博弈的支付矩阵如下:乙合作斗争合作(100,100)(S,T)甲斗争(T,S)(0,0)由于这个博弈是对称

2、的,因此,只需要解其中一个人的最优反应即可(对于对称博弈而言,两个人的占优策略及其支付是完全相同的),我们不妨解乙的反应。要使“斗争”为占优策略,意味着无论甲选择什么行动,对于乙而言,斗争总是好于合作,于是,若甲选择合作,那么乙选择斗争的收益是T,选择合作的收益是100,因此T>100;若甲选择斗争,乙选择斗争的收益是0,选择合作的收益是S,要使对于乙而言斗争好于合作,则0>S。因此要选C。2.某博弈中甲乙双方各有三个策略,其相应的支付矩阵如下图所示:问:(1)甲会不会采用策略A,为什么?(2)请剔除上述支付矩阵里的占劣策略。(3)请找出该博弈的纯策略

3、纳什均衡。乙DEFA3,73,51,2甲B4,22,76,4C3,74,82,51答案:1)甲不会采用策略A,策略A是甲的劣策略,它是劣于C的。2)对于甲而言,A是一个劣策略。对于乙而言,F是一个劣策略(做到这一步即可算正确)。但当剔除了A和F这两个策略后,对乙而言,D又变成了劣策略,可以剔除。当剔除了A,F,D之后,对甲而言,B是劣策略,可以剔除。因此,纳什均衡是(C,E)(做到这一步也是正确的,且可以一并解决问题3)3)可以用重复剔除劣策略法,如上,纳什均衡为(C,E)。也可以用最优反应法(用红色数字标出),答案相同。3.(05年北京大学考研题)求

4、下列博弈的纯策略纳什均衡。这个博弈在经典矩阵博弈的名称是什么?参与人2LR参与人1U(2,6)(5,5)D(0,0)(6,2)答:步骤1:先找两人的最优反应,用划圈法。(注意:划圈的时候,要记住,如果找列参与人的最优策略,就要固定行参与人的行动。反之亦然)。步骤2:两人的最优反应的组合即是纳什均衡。即(U,L)和(D,R)(注意不要写(6,2),(2,6))。这个博弈在经典矩阵博弈中叫做“协调博弈”。4.A和B手中各有一个魔瓶,魔瓶中各有1元钱,他们可以把这1元钱从魔瓶取出放入自己的衣袋,也可以把这1元钱放入对方的衣袋。但是,如果放入自己的衣袋,这1元

5、钱会变为2元钱,如果放入对方的衣袋,这1元钱会魔术般地变为4元。(1)假设A和B互不关心,只关心自己的收益,他们各自的备选行动是“把1元钱放入自己的口袋”(可用字母D表示),“把1元钱放入对方的口袋”(可用字母C表示)(注意只有这两个备选行动,没有其他可能的行动),写出该博弈的货币收益矩阵,并解出它的占优策略均衡。(2)假设A是段誉王子,B是王语嫣姑娘,段誉非常喜欢王语嫣,在计算自己的支付时,段誉会把王语嫣的收入乘以r加在自己的收入上,而王语嫣则并不关心段誉,她只计算自己的货币收入,例如,如果段誉有x元钱,王语嫣有y元钱,则段誉的心理支付是x+ry,而

6、王语嫣的心理支付为y。如果该博弈最后的均衡结果是段誉总是往王语嫣的衣袋里放1元钱,而王语嫣也往自己的衣袋里放了1元钱,问r的取值范围是多少?(3)假设A是贾宝玉,B是林黛玉,两人互相关爱对方,因此,在计算自己的心理支付时,两人互相把对方的收入乘以r加在自己的收入上,例如,如果宝玉有x元钱,黛玉有y元钱,则宝玉的心理支付是x+ry,而黛玉的心理支付为y+rx。如果该博弈最后的均衡结果是双方都总是往对方的衣袋里放1元钱,问r的取11值范围是多少?假设﹤r﹤,那么纯策略纳什均衡解是什么?322解答:(1)这个博弈的货币收益矩阵如下:BCDC(4,4)(0,6

7、)AD(6,0)(2,2)这是一个囚徒困境博弈,该博弈的占优策略均衡是(D,D)。(2)段誉和王语嫣的心理支付矩阵如下:王语嫣CDC(4+4r,4)(6r,6)段誉D(6,0)(2+2r,2)“该博弈最后的均衡结果是段誉往王语嫣的衣袋里放了1元钱,而王语嫣也往自己的衣袋里放了1元钱”,亦即根据原题目,(C,D)是一个纳什均衡。余江锋的解法:对于王语嫣而言,D是一个占优策略,因此不需考虑王语嫣选择C策略的情况。当王语嫣选择D的时候,段誉选择C好于D,就可以使(C,D)成为纳什均衡。故令6r>2+2r,解得r>1/2。(3)宝玉和段誉的心理支付矩阵如下:黛

8、玉CDC(4+4r,4+4r)(6r,6)宝玉D(6,6r)(2+2r,2+2r)由原题目,(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。