博弈论基础复习-11.doc

博弈论基础复习-11.doc

ID:52524417

大小:31.00 KB

页数:10页

时间:2020-03-28

博弈论基础复习-11.doc_第1页
博弈论基础复习-11.doc_第2页
博弈论基础复习-11.doc_第3页
博弈论基础复习-11.doc_第4页
博弈论基础复习-11.doc_第5页
资源描述:

《博弈论基础复习-11.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、《博弈论基础》复习大纲一、辨析题(2×5=10分)二、简答题(5×7=35分)1.描述双人策略型(标准型)博弈的基本结构及其纳什均衡。你是如何理解纳什均衡的?(1)标准式博弈记为:G={S1,S2,…,Sn;u1,u2,…,un}。其基本要素包括:局中人、策略(策略组合)、支付(支付函数)(2)局中人:博弈的参与人i博弈的参与人集合I:i∈I={1,2,…,n}(3)纯策略:指局中人在博弈中可以选择采用的行动方案。每个局中人都有可供其选择的多种策略,参与人i的纯策略si∈Si①参与人i的策略集(纯策略空间)为Si,i∈I  ②策略组合:s=(s1,s2,…,si,…,s

2、n)③策略组合空间:S=×iSi(4)支付(效用):每个局中人从各种策略组合中获得的收益,由于它是参与人策略组合的函数,又称为支付函数每个参与人的支付函数记为ui(s)=ui(s1,s2,…,sn),si∈Si(5)Nash均衡在博弈G={S1,S2,…,Sn;u1,u2,…,un}中,如果策略组合s*=(s1*,s2*,…,sn*)满足对每一参与者i,si*是他针对其他参与者所选策略s-i*=(s1*,s2*,…si-1*,si+1*,…,sn*)的最优反应策略,则称策略组合s*=(s1*,s2*,…,sn*)为该博弈的一个纳什均衡。即:  ui(si*,s-i*)≥

3、ui(si,s-i*),  "si∈Si纳什均衡是一种相对稳定状态,没有参与者有动机独自偏离纳什均衡下的策略选择。2.分析两人两策略博弈构成囚徒困境博弈应满足的条件。囚徒困境博弈说明了什么问题?合作背叛合作R,RS,T背叛T,SP,P条件:(1)T>R>P>S(2) 2R>T+S或2R>2P囚徒困境反映个人最佳选择并非团体最佳选择,说明个人利益与社会利益的冲突。3.描述双人策略型博弈的纯策略和混合策略。(1)纯策略:指局中人在博弈中可以选择采用的行动方案。每个局中人都有可供其选择的多种策略,参与人i的纯策略si∈Si  参与人i的策略集(纯策略空间)为Si,i∈I  策

4、略组合:s=(s1,s2,…,si,…,sn)  策略组合空间:S=×iSi(2)混合策略混合策略:若参与人i有K个纯策略:Si={si1,…,siK},则概率分布si=(si1,…,siK)称为i的一个混合策略,这里sik=s(sik)是i选择sik的概率,对于所有的k=1,2,…,K,0≤sik≤1,∑ksik=1。纯策略为混合策略的一个特例。混合策略空间:参与人i的所有混合策略的集合,记为åi混合策略组合空间:å=×iåi4.简要分析扩展型博弈(博弈树)的构成要素。博弈树的基本元素有:(1)节点:x∈X,又称决策结,简称“结”(2)枝:连结结点的连线(3)信息集:

5、一些节点的集合。在同一信息集中,局中人面临完全相同的决策形势。(4)结:包括:  ①初始结:博弈的起点。  ②决策结:参与人采取行动的时点。  ③终点结:博弈行动路径的终点。5.什么是子博弈和子博弈精炼(完美)纳什均衡?什么是完美信息博弈?简析完美信息博弈中逆向归纳法的求解思路。(1)子博弈:一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结T(x)(包括终点结)组成,它满足:①x是一个单结信息集,即h(x)={x};②对于所有的x’∈T(x),如果x’∈h(x’),则x’∈T(x)。条件①是指子博弈必须从一个单结信息集开始;条件②说明子博弈的信息集和支付向量

6、直接承自原博弈。这意味着子博弈不能切割原博弈的信息集。同时,任何博弈是它自身的子博弈。(2)子博弈精炼Nash均衡子博弈精炼(完美)纳什均衡:扩展式博弈的策略组合s*=(s1*,s2*,…,sn*)是一个子博弈精炼纳什均衡,如果:①它是原博弈的纳什均衡;②它在每一个子博弈上给出纳什均衡。(3)完美信息博弈:一个博弈的所有信息集都是单结的。(4)完美信息博弈中逆向归纳法的求解思路:(画图解释好)假设只有两个阶段(参与人2在观察到参与人1的行动后再行动),当博弈进入第二阶段时,给定参与人1的选择a1∈A1,则参与人2的决策是使:     u2(a1,a2)我们用a2*=R2

7、(a1)代表上述最优化问题的解(参与人2的反应函数)。由于参与人1知道参与人2在第二阶段的决策规则,参与人1在第一阶段的决策是:      u1(a1,R2(a1)) 设其解为a1*,则该博弈的子博弈精炼纳什均衡是(a1*,R2(a1)),均衡结果为(a1*,R2(a1*))。6.理解完全信息动态博弈下的纯策略和行动。行动与策略(1)行动:是参与人在博弈的某个时点(某个信息集)的决策变量。   行动组合:参与人的行动的有序集。   (2)策略:是参与人在给定信息集情况下的行动规则,它规定参与人在什么时候选择什么行动。  在静态博弈中,策略

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。