石头-剪刀-布---三人博弈课件.pptx

石头-剪刀-布---三人博弈课件.pptx

ID:57253463

大小:895.18 KB

页数:25页

时间:2020-08-03

石头-剪刀-布---三人博弈课件.pptx_第1页
石头-剪刀-布---三人博弈课件.pptx_第2页
石头-剪刀-布---三人博弈课件.pptx_第3页
石头-剪刀-布---三人博弈课件.pptx_第4页
石头-剪刀-布---三人博弈课件.pptx_第5页
资源描述:

《石头-剪刀-布---三人博弈课件.pptx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、(一)“石头,剪刀,布”游戏(Rock,Scissor,Paper)思考:双方应该怎么选择才是最优的?是否存在绝对致胜的方法?我们总是在选择自己的战略前试图猜中对手的行动选择;同时,我们又会力图避免自己的选择被对方猜中,还要根据自己对对方行动的事前预测来做出最优的行动选择,即这样的游戏行动选择带有随机性。(二)著名的“囚徒困境”(Prisoners’Dilemma)假设有两个小偷联合犯事,私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行单独审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两人都认罪,则各被判刑8年。如果一人认罪,另一人不认,则认罪者立即释放,不认罪者加重判刑至10年。

2、如果两人都不认罪,则警方因证据不足不能判两人有罪,但可以因私入民宅的罪名将两人各判入狱一年。并且,每个小偷都被告知,他的同伙也面对着同样的政策。想想:他们会如何选择,最终的决策结果会是什么?分析:这个模型有如下要素:1.两个小偷必须在不知道对方的选择的情况下独立进行自己的决策2.双方都会为自己的利益考虑,即使自己的盈利最大化将双方的具体选择和相应的结果描述如下:-8-80-10-100-1-12认罪不认罪认罪1不认罪对1来说无论2选择什么,他选择‘认罪’总是最优的,根据对称性,对于2,‘认罪’也是最优的,所以模型的最终选择结果是(认罪,认罪)但是,实际上,显然(不认罪,不认罪)是对双方最好的结

3、果。所以,在个人理性与集体理性之间存在不一致性。我们假定两个小偷都只在乎各自的刑期,且盈利等于刑期的相反数博弈与决策:博弈是建立在相互猜测对方的决策过程基础上的决策,即是“互动性”的决策。博弈论是建立在理性人的假设基础之上(理性人一般是指主体所追求的唯一目标是自身经济利益的最大化),博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略,被广泛应用到经济活动和其他社会科学领域当中。上述两个例子,其实都可以被描述为一局博弈,而且都是二人博弈(只有两个参与者),其中隐含了时间的动态性质,被称为静态战略式博弈。下面我们给出博弈模型的战略式数学描述GameTheory局中人(Players)

4、:可以是个人也可以是团体、组织等,在博弈论中假定局中人是理性人。行动空间(Actionspace):每个局中人都有一行动集,而每个人在自己的行动集当中的选择所构成的一组策略,被称为行动空间,即上述A。盈利函数(效用函数Payofffunction):指局中人从博弈中获得的效用水平,大多是数值型的,来表示自己在一局博弈当中的盈利。显然,它是A的函数,并且满足线性变换。(Rock,Scissor,Paper)001-1-11-11001-11-1-11002石头剪刀布石头剪刀布(Rock,Scissor,Paper)显然,从支付矩阵上看,不存在一个对双方都是最优的决策,但是无论双方的选择是什么,各

5、自的效用函数之和总是为零。这样的博弈称为二人零和博弈那么我们怎么选择才能使自己的盈利最大呢?既然,局中人的行动具有随机性,我们对每一行动选择赋予概率,组成该博弈的混合战略。局中人1希望最大化自己的期望效用,而局中人2希望最小化1的效用(等价于最大化自己的期望效用,因为是零和博弈),根据二人零和博弈理论,1和2的决策问题变为:在博弈理论中,纳什均衡是一个非常重要的概念,它表达了博弈的基本原理,我们简单地给出它的定义:对二人博弈,用计算机求解纳什均衡常用的Lemke-Howson算法主要运用下述定理:LINGO程序如下:model:sets:k/1..3/:p;n/1..3/:q;pay(k,n)

6、:Ma,Mb;endsetsdata:Ma=01-1-1011-10;Mb=0-1110-1-110;enddatava=@sum(pay(i,j):Ma(i,j)*p(i)*q(j));vb=@sum(pay(i,j):Mb(i,j)*p(i)*q(j));@for(k(i):@sum(n(j):Ma(i,j)*q(j))<=va);@for(n(j):@sum(k(i):Mb(i,j)*p(i))<=vb);@sum(k:p)=1;@sum(n:q)=1;@free(va);@free(vb);End运行结果:VariableValueVA0.000000VB0.000000P(1)0.3

7、333333P(2)0.3333333P(3)0.3333333Q(1)0.3333333Q(2)0.3333333Q(3)0.33333331.我们可以这么理解该游戏的混合战略,当每个人以同等的概率随机的选择时,他们认为这三个行动一样好,即没有对哪个的偏好,此时对于对方的选择,你选择哪一个行动所获得的期望效用是相同的,所以你选择哪个是无差别的。2.对于该游戏,我们选取的效用函数构成了零和博弈(Z

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。