数学建模(动态规划)

数学建模(动态规划)

ID:42269482

大小:654.91 KB

页数:76页

时间:2019-09-10

数学建模(动态规划)_第1页
数学建模(动态规划)_第2页
数学建模(动态规划)_第3页
数学建模(动态规划)_第4页
数学建模(动态规划)_第5页
资源描述:

《数学建模(动态规划)》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、动态规划教学内容:∑动态规划问题实例∑动态规划的基本概念与原理∑动态规划应用举例引言动态规划是解决多阶段决策过程最优化的一种方法。该方法是由美国数学家贝尔曼(R...eE.Bellman)等人在20世纪50年代初提出的。他们针对多阶段决策问题的特点,提出了解决这类问题的“最优化原理”,并成功地解决了生产管理、工程技术等方面的许多问题,从而建立了运筹学的一个新的分支,即动态规划。Bellman在1957年出版了《DynamicProgramming》一书,是动态规划领域中的第一本著作。动态规划问题及实例动态规划是解决多阶段决策问题的一种方法,是现代企业管理中的

2、一种重要决策方法,可用于最优路径问题、资源分配问题、生产计划和库存问题、投资问题、装载问题、排序问题及生产过程的最优控制等。动态规划模型的分类:以“时间”角度可分成:离散型和连续型。从信息确定与否可分成:确定型和随机型。从目标函数的个数可分成:单目标型和多目标型。动态规划问题及实例一、多阶段决策过程多阶段决策过程是指这样一类特殊的活动过程,他们可以按时间顺序分解成若干相互联系的阶段,在每个阶段都要做出决策,全部过程的决策是一个决策序列,所以多阶段决策过程也称为序贯决策过程。这种问题就称为多阶段决策问题。二、多阶段决策问题的特点过程可分为若干个相互联系的阶段;

3、每一阶段都对应着一组可供选择的决策;每一决策的选定即依赖于当前面临的状态,又影响以后总体的效果。动态规划问题及实例三、具体实例1、最短路线问题给定一个线路网络,要从A向F铺设一条输油管道,各点间连线上的数字表示距离,问应选择什么路线,可使总距离最短?动态规划问题及实例2、生产与存储问题:某工厂每月需供应市场一定数量的产品。供应需求所剩余产品应存入仓库,一般地说,某月适当增加产量可降低生产成本,但超产部分存入仓库会增加库存费用,要确定一个每月的生产计划,在满足需求条件下,使一年的生产与存储费用之和最小。动态规划的基本概念与原理动态规划的基本概念阶段;状态;决策

4、和策略;状态转移方程;指标函数。动态规划的基本概念与原理一。基本概念阶段:是指问题需要做出决策的步数。阶段总数常记为n,相应的是n个阶段的决策问题。阶段的序号常记为k,称为阶段变量,k=12k=1,2,…,nkn.k即可以是顺序编号也可以是逆序编号,常用顺序编号。状态:各阶段开始时的客观条件,第k阶段的状态常用状态变量sk表示,状态变量取值的集合成为状态集合,用Sk表示。例如,案例1中,S1={A},S2={B1,B2}.状状状状状状态态态态态态C5218B34D1314C25E65146A83D22F57C3341EB822D733C44第1阶段第2阶段第

5、3阶段第4阶段第5阶段决策:是指从某阶段的某个状态出发,在若干个不同方案中做出的选择。表示决策的变量,称为决策变量,用u(s)表示。kku(s)表示第k阶段当状态处于s时的决策变量。kkk例如:u3(C2)=D1表示走到C阶段,当处于C2路口时,下一步到D.1决策变量允许的取值范围称为允许决策集合,第k阶段状态为sk时的允许决策集合记为Dk(sk),例如:D2(B1)={C1,C2,C3}策略:一个按顺序排列的决策组成的集合。由每段的决策按顺序排列组成的决策函数序列称为k子过程策略。简称子策略,记为。即当k=1时,此决策函数序列成为全过程的一个策略,简称策略

6、,记为:在实际问题中,可供选择的策略有一定的范围,此范围称为允许策略集合,用P表示。状态转移方程:是从上一阶段的某一状态值转变为下一阶段某一状态值的转移规律,用s=T(s,u)表示k+1kkk表示。指标函数:分阶段指标函数和过程指标函数。阶段指标函数是指第k阶段从状态sk出发,采取决策uk时的效益,用v(s,u)表示。而过程指标函数是从第k阶段的某状态出发,kkk采取子策略时所得到的阶段效益之和:最优指标函数:表示从第k阶段状态为sk时采用最佳策略到过程终止时的最佳效益。记为其中opt可根据具体情况取max或min。基本方程:此为逐段递推求和的依据,一般为:

7、⎧⎪fs()=+opt{vsus(,())fus(())}knn=,1−,,?2,1⎪⎪kkkkkkk+1kkuDskkk∈()⎨⎪⎪f()0s=⎪⎩nn++11式中opt可根据题意取max或min.例如,案例1的基本方程为:⎧⎪fs()=+min{dsus(,())fus(())}k=5,4,3,2,1⎪⎪kkuDs∈()kkkkk+1kk⎨kkk⎪⎪⎪f()0s=⎩66最优性原理:最优策略的子策略必为最优。不管过去的状态和决策如何,从眼下直到最后的诸决策必构成最优子策略。动态规划的优点:•可把一个N维优化问题化成N个一维优化问题求解。•函数方程中附加某些

8、约束条件,可使求解更加容易。•求得最优解以后,可得所

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。