随机动态规划.ppt

随机动态规划.ppt

ID:52038844

大小:741.00 KB

页数:10页

时间:2020-03-30

随机动态规划.ppt_第1页
随机动态规划.ppt_第2页
随机动态规划.ppt_第3页
随机动态规划.ppt_第4页
随机动态规划.ppt_第5页
资源描述:

《随机动态规划.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、1动态规划DynamicProgramming(DP)动态规划在经济管理中的应用随机动态规划简介随机动态规划不同于确定型动态规划之处在于其下一阶段的状态不是由当前阶段的状态以及决策完全确定。确切地说,下一阶段的状态是什么,服从一个概率分布。不过,这个概率分布仍由当前阶段的状态以及决策完全确定。由此,我们得到随机动态规划的基本结构。下图给出了这种结构的形象描绘:2动态规划DynamicProgramming(DP)随机动态规划的基本结构图skuks1k+1sNk+1s2k+1optk+1阶段p1fk(sk)k阶段p2pN…v1v2vN……f

2、k+1(s1k+1)fk+1(s2k+1)fk+1(sNk+1)决策ukDk(sk)随机动态规划的基本方程:fk(sk)=opt{pi(vi+fk+1(sik+1))}ukDk(sk)i=1Nfn(sn)=opt{pivi}unDn(sn)i=1Nk=n-1,…,2,13动态规划DynamicProgramming(DP)某公司相信对一个开发项目进行投资会取得成功。若投资成功的话,公司就可以获得与投资数额相同的利润,若投资失败的话,公司非但得不到利润,就连投资也完全不能收回。公司对有关资料详细分析后认为,每次投资成功的概率为2/

3、3,失败的概率为1/3。目前公司对此项目进行投资的总资金有3百万元,为了有效控制投资风险,公司计划分三次投入资金(如果有资金的话)。公司需要作出的决策是每次应投入多少资金(以百万元为单位),才能使三次投资结束后公司最终获得2百万元利润(即最终拥有5百万元总资金)的概率最大。下面我们通过一个例子来具体阐述如何求解动态规划问题。请看案例——4动态规划DynamicProgramming(DP)1、阶段k:第k次投资,k=1,2,32、状态变量sk:第k次投资时拥有可用于投资的资金数量。3、决策变量uk:第k次投资的资金数量。决策集合Dk(sk

4、)={uk

5、uk=0,1,2,…,sk}4、状态转移方程:sk+1=sk+uk第k次投资确实成功。sk-uk第k次投资确实失败。5、定义阶段指标值(函数):成功的概率为2/3,失败的概率为1/3。5动态规划DynamicProgramming(DP)6、定义fk(sk):第k次投资时拥有可用于投资的资金数量sk,并一直投资到第3次投资结束后公司获得2百万元利润的最大概率。我们应该注意到这样一个事实——即使前两次投资失败了,公司仍然有机会最终赢得2百万元的利润。7、随机动态规划的基本结构图:skuksk-uksk+ukk+1阶段fk(sk)

6、k阶段fk+1(sk+uk)决策uk=0,1,…,sk()maxfk+1(sk-uk)成功,2/3失败,1/36动态规划DynamicProgramming(DP)8、随机动态方程:fk(sk)=max{(2/3)fk+1(sk+uk)+(1/3)fk+1(sk-uk)}uk=0,1,…,skk=3,2,1f4(s4)=△0s451s4≥57动态规划DynamicProgramming(DP)9、逆序递推求解随机动态方程。k=3s3=0,1,2,3,4,5,…,12s301234≥5f3(s3)0002/32/31u*3………2,31

7、,2,3,40,≤s3-5fk(sk)=max{(2/3)fk+1(sk+uk)+(1/3)fk+1(sk-uk)}uk=0,1,…,skk=3,2,1f4(s4)=△0s451s4≥58动态规划DynamicProgramming(DP)k=2s2=0,1,2,3,4,5,6u2s2(2/3)f3(s2+u2)+(1/3)f3(s2-u2)f2(s2)u*201234000…1000…204/94/94/91,232/34/92/32/32/30,2,342/38/92/32/32/38/91≥5110,≤s3-5s301234≥5f

8、3(s3)0002/32/31u*3………2,31,2,3,40,≤s3-59动态规划DynamicProgramming(DP)k=1s1=3u2s2(2/3)f2(s1+u1)+(1/3)f2(s1–u1)f1(s1)u*1012332/320/272/32/320/271u2s2(2/3)f3(s2+u2)+(1/3)f3(s2-u2)f2(s2)u*201234000…1000…204/94/94/91,232/34/92/32/32/30,2,342/38/92/32/32/38/91≥5110,≤s3-510动态规划Dynam

9、icProgramming(DP)u2s2(2/3)f2(s1+u1)+(1/3)f2(s1–u1)f1(s1)u*1012332/320/272/32/320/271于是,我们有最优策略:s

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。