运筹学第六讲对策论.ppt

运筹学第六讲对策论.ppt

ID:51616020

大小:570.05 KB

页数:38页

时间:2020-03-26

运筹学第六讲对策论.ppt_第1页
运筹学第六讲对策论.ppt_第2页
运筹学第六讲对策论.ppt_第3页
运筹学第六讲对策论.ppt_第4页
运筹学第六讲对策论.ppt_第5页
资源描述:

《运筹学第六讲对策论.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、对策论GameTheory运筹学OperationsResearch(1)1713年,瓦德格拉夫提出两人对策的经典模型;对策论历史简介:(2)古诺和博特兰分别在1838年与1883年提出对策论最经典的模型;(4)1944年,冯·诺依曼和摩根斯坦合著出版《博弈论与经济行为》一书,被看作是对策论真正发展的起点;(3)中国古代的“齐王赛马”;(5)1994年,瑞典皇家科学院决定将诺贝尔经济学奖授予纳什、哈萨尼和泽尔腾三人,表彰他们在博弈理论和应用方面作出的杰出贡献;(6)目前,博弈论在定价、招投标、谈判、拍卖、委托—代理

2、以及很多的经营决策中得到应用,它已成为现代经济学的重要基础。现代对策论总体上是一门新兴的发展中的学科。Nash对对策论的贡献有:(i)合作对策中的讨价还价模型,称为Nash讨价还价解;(ii)非合作对策的均衡分析。-1,-1-10,00,-10-5,-5囚徒1囚徒2坦白不坦白坦白不坦白(囚徒的困境)引例警察抓住两个合伙犯罪的嫌疑犯,但缺乏足够的证据指证他们的罪刑,若其中一个供认犯罪,就能确认罪名成立。为得到所需的口供,警察将两嫌疑犯分开关押并给他们同样的选择机会,若两人都拒不认罪,则他们会以较轻的妨碍公务罪各判一年

3、徒刑;若有一人坦白认罪,则坦白者立即释放,而另一个人则判10年徒刑,若两人同时认罪,则他们各被判5年徒刑,现两个嫌疑犯该如何采取各自的策略(坦白、不坦白)对自己有利?这是一个二人非零和对策问题,可用一个矩阵来表示两囚徒的得益,如下表所示:对策论(gametheory)亦称博弈论:是研究具有对抗或竞争性质现象的数学理论和方法,它既是数学的一个分支,也是运筹学的一个重要学科。对策论概述引言对策行为:是指具有竞争或对抗性质的行为,在这类行为中,参加斗争或竞争的各方各自具有不同的利益和目标,各方需考虑对手的各种可能的行动方

4、案,并力图选择对自己最为有利或最为合理的方案。对策:是一些个人、对组或其它组织,面对一定的环境条件,在一定的规则下,同时或先后从各自允许的行为或策略中进行选择并加以实施,各自取得相应结果的过程。对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理方案的数学理论和方法。是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。即它是研究聪明而又理智的决策者在冲突或合作中的策略选择理论。它将成为当代经济管理学科的前沿领城。一个对策需要3个基本要素:(1)局中人(players)(2)

5、策略集(strategies)(3)得益函数(payoffs)对策三要素引言策略集:在一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略,所有行动方案的集合成为策略集。每个局中人i都有自己的策略集,每一局中人的策略集中至少包含两个策略。全体局势的集合S可用各局中人的策略集的迪卡尔集表示,即局中人:在一个决策行为中,有权决定自己行动方案的对策参加者,常用I表示局中人的集合。一般要求一个对策中至少要有两个局中人。是一个局势。得益函数(也称赢得函数):在一局对策中,对应于各参与方每一组可能的决策选择,都

6、应有一个结果表示该策略组合下每个参与方的得益,常用得益函数表示。若一个策略中有n个参与方,则他们可形成一个策略组对策的结构和分类引言纳什均衡NashEquilibrium对于对策中的每一个局中人,真正成功的措施应该是针对于其他局中人所采取的每次行动,相应地采取有利于自己地反应策略,于是每一个局中人应采取的必定是他对其他局中人策略的预测的最佳反应。【定义】在对策G={S1,S2…,Sn;h1,h2…hn}中,如果由各个对策方的各选取一个策略组成的某个策略组合(S1*,S2*…,Sn*)中,任一对策方i的策略Si*,都

7、是对其余策略方策略的组合(S1*,…,S*i-1,S*i+1…,Sn*)的最佳策略,即hi(S1*,…,S*i-1,Si*,S*i+1,…Sn*)≥hi(S1*,…,S*i-1,Sij,S*i+1,…,Sn*)对任意Sij∈Si都成立,则称(S1*,…,Sn*)为G的一个纯策略意义下的“纳什均衡”(NashEquilibrium).用G表示一个对策,若一个对策中有n个局中人,则每个局中人可选策略的集合称为策略集,分别用S1,S2,…,Sn表示;Sij表示局中人i的第j个策略,其中j可取有限个值(有限策略对策),也可

8、取无限个值(无限策略对策);对策方i的得益则用hi表示;hi是各对策方策略的多元函数,n个局中人的对策G常写成:G={S1,…,Sn;h1,…hn}纳什均衡纳什均衡定义定义中各选取一个策略组成的某个策略组合构成一个局势,其最优局势称为纯策略意义下的最优局势.纳什均衡【例1】假设有三个厂商在同一市场上生产销售完全相同的产品,它们各自的产量分别用m1、m2和m3

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。