微分对策的具体应用

微分对策的具体应用

ID:43692439

大小:25.00 KB

页数:4页

时间:2019-10-12

微分对策的具体应用_第1页
微分对策的具体应用_第2页
微分对策的具体应用_第3页
微分对策的具体应用_第4页
资源描述:

《微分对策的具体应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、微分对策的具体应用对策这一概念有许多推广,微分对策是其中之一,而且出现较早,发展也较成熟。微分对策是局中人在每一时刻t皆要做岀一个决定的连续情况,例如追逃问题。追和逃的每时每刻皆要做出某种选择。设在时刻t,对局的状态变量(例如,位置、方向、速度等)为x(t)=(X](t),x2(t),,Xn(t))o设在此时,局中人甲选取的策略(方向速度等)为y=(yi,y2,,yp),其中yi=yi(t),—般可设逐<=沪=6如6是常数;局中人乙选取的策略z二⑵,Z2,……,Zq)也满足类似的关系。y,z称为控制变量(策略),他们按照微

2、分方程组dxi/dt=fj(x;y;z)(i=l,2,……,n)来控制状态变量的运动。当状态主变量达到某一给定的闭集时对局即告结束。寻求最优的y,z是微分对策的基本课题之一。下面看一道运用微分对策的题冃。Velociraptor,是生活在距今约七千五百万年前的一种食肉恐龙。古生物学家认为这是一种非常顽强地猎食其它动物的野兽,而且可能是成对或成群地外出追猎。然而,不幸的是,无法像观察现代哺乳食肉动物在野外是如何追猎其食物的行为那样,观察到Velociraptor在野外的追猎行为。一组古生物学家来到你们队请求你们在Veloci

3、raptor的追猎行为的建模方面给予帮助,他们希望把你们的结果和研究狮子、老虎及其它类似的食肉动物行为的生物学家的研究报告相比较。成年的Velociraptor平均长三米,骯高0.5米,体重约为45千克。据估计,这种动物跑得非常快。速度可达六十千米每小时,持续时间约十五秒。在一开始的突然加速后,它要停下来并在其肌肉屮积聚乳酸以恢复体力。假设Velociraptor捕食一种称为Thescelosaurus的大小,与Velociraptor差不多的双足食草动物。从Velociraptor化石的生物力学分析得知Velocirap

4、tor可以五十千米每小时的速度长时间奔跑。假设Velociraptor是一只独居的猎食其它动物的野兽,试设计单个的Velociraptor潜近猎物并追猎一只单个的Thescelosaurus策略以及被追捕物逃避追捕的策略的数学模型。假设当Velociraptor潜近到Thescelosaurus的十五米范围内时,Thescelosaurus总能觉察到,根据栖息地及气候条件的不同,甚至在(多达五十米的)更大的范围内觉察欲捕食它的动物的存在。此外,由于Velociraptor的身体结构及体能,它在全速奔跑时的拐弯半径是受到限制

5、的。据估计,拐弯半径大约是其骯高的三倍。另一方面,Thescelosaums却是极其灵活的,其拐弯半径只有0.5米。更现实地假设Velociraptor成对外出追猎,试设计一个新的关于成对的Velociraptor潜近猎物并追猎一只单个的Thescelosaurus的策略以及被追捕物逃避追捕的策略的数学模型。利用前面给出的假设和限制。下面我们用对策数论语表示这一问题的数学陈述。捕食者和被捕食者之间的拦截和逃避的竞争属于线性微分对策的广泛而形式不同的范筹。在追捕者和逃跑者的微分对策中,两个或多个局中人在遵从对它们的运动的某些

6、限制下试图极大化或极小化它们Z间的距离。和经典的对策论不同,微分对策必须包括微分方程方法的应用以及利用定义局中人的状态和目标的连续的波动。在传统的或者微分的对策中,局中人试图在一组可供选择的策略中挑选策略使得称为支付函数的值极大化,其中每个局中人的支付是由所有局屮人的选择的某个函数确定的。在零和对策情形,所有局中人互相都处于直接竞争的地位使得由他们的支付函数表示的目标正好符号相反。追逃对策属于这个分类;追逐者试图使自己和逃跑者Z间的距离极小,而逃跑者却试图使这个距离极大。在VelociraptorThescelosaums

7、p这样的追逐对策的情形,支付函数是一个简单的二元函数:仅有的有关的结果就是抓住或者逃走。相对于度对策,这种对策称为类对策,度对策的支付可以在更大的可能值上取值。在有些情形,把类对策嵌入到度对策中,同时,把抓住时间(或者逃跑者的分离时间)作为支付函数可能是有用的。尽管在纯粹确定性的试验中这不是必要的,但是一对特定的策略对的平均抓住时间可能提供了一个策略的功效的有用的统计度量。在微分对策中有两类变量:状态变量,它规定了任意给定时刻整个系统的完全的结构,还有控制变量,对策的参与者用它以有利于极大化它们自己的支付函数的方式来改变状

8、态函数。在惯用的追逃对策中通常的状态变量是参与者的空间坐标;控制变量可以包括最犬旋转角或者加速度向量。所有局屮人都可存取在任意给定点和时刻处的状态变量的一个完全集的对策称为完全信息对策;若不是这样的对策称为非完全信息对策。非完全信息对策缺少精确的解析方法。通常,评论这种对策的最好的方法是用离散模型,它可

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。