混合策略课件.ppt

混合策略课件.ppt

ID:51246475

大小:754.00 KB

页数:35页

时间:2020-03-20

混合策略课件.ppt_第1页
混合策略课件.ppt_第2页
混合策略课件.ppt_第3页
混合策略课件.ppt_第4页
混合策略课件.ppt_第5页
资源描述:

《混合策略课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库

1、混合策略找到不确定情况下的最优反应2021/8/131张醒洲,大连定义在一个n人博弈的标准式表述中,参与人的策略空间为,收益函数为,我们用表示此博弈。纳什均衡博弈的标准式和纳什均衡2021/8/132张醒洲,大连举例:猜硬币模型两个参与人{1,2}每个参与人的策略空间为{H,T}收益零和试着找到纳什均衡参与人2参与人1正面背面正面-1,11,-1背面1,-1-1,1两个男孩各自有一个硬币并且他们必须选择将硬币的正面朝上还是背面朝上。如果两个硬币朝上的面相同(即都是正面或都是背面),则参与人2将赢

2、得参与人1的硬币;否则,参与人1将赢得参与人2的硬币。2021/8/133张醒洲,大连猜硬币如果参与人的策略一致——(正面,正面)或(反面,反面)—则参与人1会偏向于改变策略;但是如果两者策略不一致—(正面,反面)或(反面,正面)—则参与人2偏向于改变策略。参与人2正面背面正面-1,11,-1参与人1背面1,-1-1,1没有一组策略满足(NE)石头-剪刀-布博弈此博弈也不存在纳什均衡无论参与人1选择哪个纯策略,参与人都可以打败他。参与人2石头剪刀布石头0,01,00,1参与人1剪刀0,10,01

3、,0布1,00,10,02021/8/135张醒洲,大连猜对方策略猜硬币博弈一个非常突出的特点是每个参与人都试图猜中对方的策略。任何这一类都没有纳什均衡至少不存在1.1.C节所定义的纳什均衡因为这一类博弈的解包含了一个参与人对其他参与人行为的不确定。现在我们介绍混合策略2021/8/136张醒洲,大连纯策略,混合策略考虑标准式博弈G={S1,····,Sn;u1,····,un}此后我们定义Si中的策略为参与人i的纯策略在本节的完全信息同时行动博弈中,一个参与人的纯策略就是他可以选择的不同行动;

4、例如,在猜硬币的博弈中,Si包含两个纯策略:正面和背面。参与人i的一个混合策略是在其策略空间Si中的(一些或全部)策略的概率分布。2021/8/137张醒洲,大连概率和信念随机事件事件有明确定义.我们可以区分不同的事件.在进行观察或试验前,我们不能肯定的说一个具体的事件会出现.我们可以判断哪些事件有可能出现,并且能判断每一个事件出现的可能性大小.概率事件的概率是对一次随机试验中该事件出现的可能性的度量如果对可能性的度量以某种客观规律或物质属性为基础,我们就用“概率”一词如果对可能性的度量以个人经

5、验、主观判断为基础,就用“主观概率”、“信念”、“置信度”等术语2021/8/138张醒洲,大连概率分布样本空间:Ω={ω1,ω2,…,ωn,…}试验中可能出现的所有基本结果ωi的集合事件由基本结果组成,是样本空间的子集。如果在试验中事件A中的一个结果出现了,就说事件A发生。概率分布就是将总概率P(Ω)=1分解到所有可能的样本点或事件上的一种方式.2021/8/139张醒洲,大连概率的公理化定义概率测度样本空间Ω上的一个概率测度是Ω的子集的一个函数P(·),它满足三条公理:公理(1)0≤P(E)

6、≤1,对任一事件E公理(2)P(Ω)=1公理(3)对任何一列互不相容的事件E1,E2,….,即Ei∩Ej=Ф(空集),i≠j,有我们称P(E)为事件E的概率。2021/8/1310张醒洲,大连混合粗略:猜硬币参与人i的一个混合策略是在其策略空间Si中的策略的概率分布举例:猜硬币S2包含两个纯策略即正面和反面,因此参与人2的一个混合策略为概率分布(q,1-q),其中q为正面朝上的概率,1-q是背面朝上的概率,并且0

7、合策略(0,1)是背面朝上的纯策略;类似地,混合策略(1,0)是正面朝上的纯策略。2021/8/1311张醒洲,大连混合策略:举例参与人2的一个混合策略为概率分布(q,r,1-q-r),其中q表示出左的概率,r表示出中的概率,1-q–r表示出右的概率。和前面一样,0

8、12,0图1.1.1atPager6参与人的一个纯策略只是其混合策略的一个特例,例如参与人2出左的纯策略可表示为混合策略(1,0.0)。2021/8/1312张醒洲,大连混合策略:定义更为一般地,假定参与人i有K个纯策略:Si={si1,…,siK}.参与人i的一个混合策略是一个概率分布(pi1,…,piK),其中piK表示对所有k=1,…,K,参与人i选择策略sik的概率,由于pik是一个概率,对所有k=1,…,K,有0≤pik≤1且pi1+···+piK=1。我们用pi表示基于Si的任意一个

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。