算法合集之《动态规划》

算法合集之《动态规划》

ID:14308346

大小:125.00 KB

页数:11页

时间:2018-07-27

算法合集之《动态规划》_第1页
算法合集之《动态规划》_第2页
算法合集之《动态规划》_第3页
算法合集之《动态规划》_第4页
算法合集之《动态规划》_第5页
资源描述:

《算法合集之《动态规划》》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、广东韶关广东北江中学方奇动态规划关健字:阶段状态决策函数递推式摘要:动态规划是解决多阶段决策最优化问题的一种思想方法。所谓“动态”,指的是在问题的多阶段决策中,按某一顺序,根据每一步所选决策的不同,将随即引起状态的转移,最终在变化的状态中产生一个决策序列。动态规划就是为了使产生的决策序列在符合某种条件下达到最优。动态规划思想近来在各类型信息学竞赛中频繁出现,它的应用也越来越受人重视。本文就是讨论如何运用动态规划的思想设计出有效的数学模型来解决问题一动态规划问题的数学描述我们先来看一个简单的多阶段决策问题。[例

2、1]现有一张地图,各结点代表城市,两结点间连线代表道路,线上数字表示城市间的距离。如图1所示,试找出从结点1到结点10的最短路径。第一阶段第二阶段第三阶段第四阶段第五阶段图1本问题的解决可采用一般的穷举法,即把从结点1至结点10的所有道路列举出来,计算其长度,再进行比较,找出最小的一条。虽然问题能解决,但采用这种方法,当结点数增加,其运算量将成指数级增长,故而效率是很低的。分析图1可知,各结点的排列特征:(1)可将各结点分为5个阶段;(2)每个阶段上的结点只跟相邻阶段的结点相连,不会出现跨阶段或同阶段结点相连

3、的情况,如不会出现结点1与结点4连、结点4与结点5连的情况。第11页共11页广东韶关广东北江中学方奇(3)除起点1和终点10外,其它各阶段的结点既是上一阶段的终点,又是下一阶段的起点。例如第三阶段的结点4、5、6,它即是上一阶段结点2、3中某结点的终点,又是下一阶段结点7、8、9中某结点的起点。根据如上特征,若对于第三阶段的结点5,选择1-2-5和1-3-5这两条路径,后者的费用要小于前者。那么考虑一下,假设在所求的结点1到结点10最短路径中要经过结点5,那我们在结点1到结点5之间会取那条路径呢?显然,无论从

4、结点5出发以后的走法如何,前面选择1-3-5这条路都总是会优于1-2-5的。也就是说,当某阶段结点一定时,后面各阶段路线的发展不受这点以前各阶段的影响。反之,到该点的最优决策也不受该点以后的发展影响。由此,我们可以把原题所求分割成几个小问题,从阶段1开始,往后依次求出结点1到阶段2、3、4、5各结点的最短距离,最终得出答案。在计算过程中,到某阶段上一结点的决策,只依赖于上一阶段的计算结果,与其它无关。例如,已求得从结点1到结点5的最优值是6,到结点6的最优值是5,那么要求到下一阶段的结点8的最优值,只须比较m

5、in{6+5,5+5}即可。这样,运用动态规划思想大大节省了计算量。可以看出,动态规划是解决此类多阶段决策问题的一种有效方法。二动态规划中的主要概念,名词术语1阶段:把问题分成几个相互联系的有顺序的几个环节,这些环节即称为阶段。2状态:某一阶段的出发位置称为状态。通常一个阶段包含若干状态。如图1中,阶段3就有三个状态结点4、5、6。3决策:从某阶段的一个状态演变到下一个阶段某状态的选择。4策略:由开始到终点的全过程中,由每段决策组成的决策序列称为全过程策略,简称策略。5状态转移方程:前一阶段的终点就是后一阶段

6、的起点,前一阶段的决策选择导出了后一阶段的状态,这种关系描述了由k阶段到k+1阶段状态的演变规律,称为状态转移方程。6目标函数与最优化概念:目标函数是衡量多阶段决策过程优劣的准则。最优化概念是在一定条件下找到一个途径,经过按题目具体性质所确定的运算以后,使全过程的总效益达到最优。三运用动态规划需符合的条件任何思想方法都有一定的局限性,超出了特定条件,它就失去了作用。同理,动态规划也并不是万能的。那么使用动态规划必须符合什么条件呢?必须满足最优化原理和无后效性。1最优化原理最优化原理可这样阐述:一个最优化策略具

7、有这样的性质,不论过去状第11页共11页广东韶关广东北江中学方奇图2态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。简而言之,一个最优化策略的子策略总是最优的。如图2中,若路线I和J是A到C的最优路径,则根据最优化原理,路线J必是从B到C的最优路线。这可用反证法证明:假设有另一路径J’是B到C的最优路径,则A到C的路线取I和J’比I和J更优,这与原名题矛盾。从而证明J’必是B到C的最优路径。最优化原理是动态规划的基础,任何问题,如果失去了最优化原理的支持,就不可能用动态规划方法计算。

8、2无后效性“过去的步骤只能通过当前状态影响未来的发展,当前的状态是历史的总结”。这条特征说明动态规划只适用于解决当前决策与过去状态无关的问题。状态,出现在策略任何一个位置,它的地位相同,都可实施同样策略,这就是无后效性的内涵。由上可知,最优化原理,无后效性,是动态规划必须符合的两个条件。四动态规划的计算方法对于一道题,怎样具体运用动态规划方法呢?(1)首先,分析题意,考察此题是否满足最优化原理与无后

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。