策略式博弈:纯策略

策略式博弈:纯策略

ID:12025223

大小:183.50 KB

页数:26页

时间:2018-07-15

策略式博弈:纯策略_第1页
策略式博弈:纯策略_第2页
策略式博弈:纯策略_第3页
策略式博弈:纯策略_第4页
策略式博弈:纯策略_第5页
资源描述:

《策略式博弈:纯策略》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、策略式博弈:纯策略2.策略式博弈:纯策略①2.1策略有好坏在一场博弈中,参与人有多个备选的策略。假如我们将一个参与人的任意两个策略——姑且称“策略A”和“策略B”——拿出来比较,如果在任何情况下(即不管对手如何出招)他选择策略A总是比选择策略B更合适,那么他就会认为策略A相对于策略B来说是一个更“好”的策略,而策略B就是相对于策略A的一个更“坏”的策略。在博弈论术语中,我们将他这个更好的策略(策略A)称优势策略,把这个更坏的策略(策略B)称劣势策略。在优势策略与劣势策略之间,参与人的理性选择是显而易见的,他将选择优势策略。虽然并不是每一场博弈都有

2、优势策略,但是在现实中的确存在大量的优势策略博弈的例子。让我们逐一来看一看这些例子。囚徒的困境②“囚徒困境”讲述的是这样一个故事③:两个惯偷,在最近一次的作案中被警察捕获;然后他们被警方隔离审查,并说明警方的政策是“坦白从宽,抗拒从严”。如果一个小偷坦白而另一个小偷抗拒,则坦白者因立功表现被释放(即入狱0个月),抗拒者因顽抗将重惩(入狱9个月);如果双方都坦白,则历次犯罪证据确凿,双方均被判入狱6个月;如果双方都抗拒,那么警察将无法得到他们过去的犯罪证据,只能以此次偷盗轻判(入狱1个月)。上述信息的文字说明可能太烦琐了,我们尝试用一种简洁的方式来

3、表达上述信息。比如,我们把双方的利害关系制作成一张表(即赢利表,payoffstable)。由于每个人有两个策略选择,两个人就有四种策略组合(即四个单元格);每个单元格中左边的数字表示左边的局中人(小偷甲)在该策略组合下的赢利,每个单元格中右边的数字表示上边的局中人(小偷乙)在该策略组合下的赢利④。由于入狱是一件倒霉事,所以赢利以负月数计(见表2.1)。表2.1囚徒的困境小偷乙抗拒坦白小偷甲抗拒-1,-1-9,0坦白0,-9-6,-6现在我来问你,这样的一个博弈中,最可能的结果将是什么呢?也许有一些读者会说,当然两个小偷都应选“抗拒”了。这样回答

4、的读者想到的大概是:①一个策略,即一条行动计划。在策略式博弈(完全信息静态博弈)中,一条行动计划表达的总是采取相同的行动,就称之为纯策略;否则就称之为混合策略。本章集中讨论纯策略情况,下一章讨论混合策略情况。②大概很多读者都已经熟知这个例子。按常理,一个众所周知的例子常常应是作者极力避免的。但是,这个例子是如此经典,以至于让我不忍心让少数还未曾接触这个例子的读者在这里错过它。而且,囚徒困境对于博弈论的影响以及迄今仍对它进行着的持续研究使我相信,任何一本博弈论著作都不能回避这个例子,即便它已经被重复讲述了千万遍。当然,熟悉这个例子的读者可以跳过此节

5、内容。③这个故事是数学家塔克(Tucker,1906-1995)教授虚构出来的,名字叫“囚徒的困境”。1950年,塔克在给心理学家的一场讲座中讲述这个虚构的故事。这个仅半页纸就可写下的故事,深深影响了20世纪后半页的经济学和其他社会科学。④请读者一定要熟记这个规则,我们以后一直都采取这个规则。大家都选“抗拒”各自才判1个月,是所有情况中对于两个人来说最好的结果。但是,更聪明的读者却会回答:两个小偷都会选“坦白”。为什么呢?我们不妨站在小偷甲的立场设身处地一想:如果小偷乙选择抗拒,则我选坦白可立即获得释放,而选抗拒则会入狱1个月,所以选择坦白对我来

6、说是最合适的;如果小偷乙选择坦白,则我选择坦白将入狱6个月,而选抗拒将入狱九个月,所以选择坦白对我来说仍是最合适的。综合这仅有的两种情况,则无论小偷乙选择抗拒还是坦白,我选择坦白总比选择抗拒好,所以我应毫不忧郁地选择坦白。反过来,站在小偷乙的立场上思考,同样的推理使我们不难发现,在任何情况下小偷乙选择坦白都比选择抗拒好,因此他也会毫不犹豫地选择坦白。显然,在这个博弈中,任何一个小偷都具有前面提及的优势策略(坦白)和劣势策略(抗拒)。博弈的结果,两个小偷将不约而同选择坦白。(坦白,坦白)这种策略组合就成为该博弈的一个稳定结果,我们把这个稳定结果称为

7、优势策略纳什均衡。因为这个结果是两个小偷均采用自己的优势策略而得到的稳定结果。“囚徒的困境”说明了,在有些博弈中,尽管某个结果是最好的,但它可能不会作为稳定结果出现,而作为稳定结果出现的恰好有可能是最糟糕的。譬如,两个囚徒若联合抗拒,那么他们都只需要入狱1个月,出狱后说不定还可以一起继续经营“小偷”这个很有钱途的事业;但是,作为稳定结果出现的,恰恰是每人入狱9个月,这对两人来说都是最糟糕的情况。“囚徒的困境”之所以令人感兴趣,不仅因为故事本身蕴藏着一种推理方式(策略思维),更在于它是很多经济和社会现象的一个影射。下面的例子,都可以看作是囚徒困境问

8、题的翻版。价格战价格战是市场竞争中一个非常常见的现象。上网搜索,可以发现家电、手机、空调、飞机票……无不充满价格战。而我要讲的例子是彩电

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。