博弈论基础复习-11.doc

ID：52524417

大小：31.00 KB

页数：10页

时间：2020-03-28

资源描述：

《博弈论基础复习-11.doc》由会员上传分享，免费在线阅读，更多相关内容在工程资料-天天文库。

1、《博弈论基础》复习大纲一、辨析题（2×5＝10分）二、简答题（5×7＝35分）1.描述双人策略型（标准型）博弈的基本结构及其纳什均衡。你是如何理解纳什均衡的？（1）标准式博弈记为：G＝｛S1，S2，…，Sn；u1，u2，…，un｝。其基本要素包括:局中人、策略（策略组合）、支付（支付函数）（2）局中人：博弈的参与人i博弈的参与人集合I：i∈I=｛1,2,…,n｝（3）纯策略：指局中人在博弈中可以选择采用的行动方案。每个局中人都有可供其选择的多种策略，参与人i的纯策略si∈Si①参与人i的策略集（纯策略空间）为Si，i∈I　　②策略组合：s=(s1,s2,…，si，…,s

2、n)③策略组合空间：S＝×iSi（4）支付（效用）：每个局中人从各种策略组合中获得的收益，由于它是参与人策略组合的函数，又称为支付函数每个参与人的支付函数记为ui(s)=ui(s1,s2,…,sn)，si∈Si（5）Nash均衡在博弈G＝｛S1，S2，…，Sn；u1，u2，…，un｝中，如果策略组合s*=(s1*,s2*,…,sn*)满足对每一参与者i，si*是他针对其他参与者所选策略s-i*=(s1*,s2*,…si-1*,si+1*,…,sn*)的最优反应策略，则称策略组合s*=(s1*,s2*,…,sn*)为该博弈的一个纳什均衡。即：　　ui(si*,s-i*)≥

3、ui(si,s-i*)，　　"si∈Si纳什均衡是一种相对稳定状态，没有参与者有动机独自偏离纳什均衡下的策略选择。2.分析两人两策略博弈构成囚徒困境博弈应满足的条件。囚徒困境博弈说明了什么问题？合作背叛合作R,RS,T背叛T,SP,P条件：（1）T>R>P>S（2）　2R>T+S或2R>2P囚徒困境反映个人最佳选择并非团体最佳选择，说明个人利益与社会利益的冲突。3.描述双人策略型博弈的纯策略和混合策略。（1）纯策略：指局中人在博弈中可以选择采用的行动方案。每个局中人都有可供其选择的多种策略，参与人i的纯策略si∈Si　　参与人i的策略集（纯策略空间）为Si，i∈I　　策

4、略组合：s=(s1,s2,…，si，…,sn)　　策略组合空间：S＝×iSi（2）混合策略混合策略：若参与人i有K个纯策略：Si＝｛si1，…，siK｝，则概率分布si＝（si1，…，siK）称为i的一个混合策略，这里sik＝s(sik)是i选择sik的概率，对于所有的k＝1，2，…，K，0≤sik≤1，∑ksik＝1。纯策略为混合策略的一个特例。混合策略空间：参与人i的所有混合策略的集合，记为åi混合策略组合空间：å＝×iåi4.简要分析扩展型博弈（博弈树）的构成要素。博弈树的基本元素有：（1）节点：x∈X，又称决策结，简称“结”（2）枝：连结结点的连线（3）信息集：

5、一些节点的集合。在同一信息集中，局中人面临完全相同的决策形势。（4）结：包括：　　①初始结：博弈的起点。　　②决策结：参与人采取行动的时点。　　③终点结：博弈行动路径的终点。5.什么是子博弈和子博弈精炼（完美）纳什均衡？什么是完美信息博弈？简析完美信息博弈中逆向归纳法的求解思路。（1）子博弈：一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结T(x)（包括终点结）组成，它满足：①x是一个单结信息集，即h(x)={x}；②对于所有的x’∈T(x)，如果x’∈h(x’)，则x’∈T(x)。条件①是指子博弈必须从一个单结信息集开始；条件②说明子博弈的信息集和支付向量

6、直接承自原博弈。这意味着子博弈不能切割原博弈的信息集。同时，任何博弈是它自身的子博弈。（2）子博弈精炼Nash均衡子博弈精炼（完美）纳什均衡：扩展式博弈的策略组合s*=(s1*,s2*,…,sn*)是一个子博弈精炼纳什均衡，如果：①它是原博弈的纳什均衡；②它在每一个子博弈上给出纳什均衡。（3）完美信息博弈：一个博弈的所有信息集都是单结的。（4）完美信息博弈中逆向归纳法的求解思路：（画图解释好）假设只有两个阶段（参与人2在观察到参与人1的行动后再行动），当博弈进入第二阶段时，给定参与人1的选择a1∈A1，则参与人2的决策是使：　　　　　u2(a1,a2)我们用a2*=R2

7、(a1)代表上述最优化问题的解（参与人2的反应函数）。由于参与人1知道参与人2在第二阶段的决策规则，参与人1在第一阶段的决策是：　　　　　　u1(a1,R2(a1))　设其解为a1*，则该博弈的子博弈精炼纳什均衡是（a1*，R2(a1)），均衡结果为（a1*，R2(a1*)）。6.理解完全信息动态博弈下的纯策略和行动。行动与策略（1）行动：是参与人在博弈的某个时点（某个信息集）的决策变量。　　　行动组合：参与人的行动的有序集。　　　（2）策略：是参与人在给定信息集情况下的行动规则，它规定参与人在什么时候选择什么行动。　　在静态博弈中，策略

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 10



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

博弈论基础复习-11.doc

博弈论基础复习-11.doc

相关文章

相关标签