用变分法求解最优控制问题word版本.ppt

用变分法求解最优控制问题word版本.ppt

ID:59718383

大小:1.72 MB

页数:102页

时间:2020-11-20

用变分法求解最优控制问题word版本.ppt_第1页
用变分法求解最优控制问题word版本.ppt_第2页
用变分法求解最优控制问题word版本.ppt_第3页
用变分法求解最优控制问题word版本.ppt_第4页
用变分法求解最优控制问题word版本.ppt_第5页
资源描述:

《用变分法求解最优控制问题word版本.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、用变分法求解最优控制问题在动态系统最优控制问题中,性能指标是一个泛函,性能指标最优即泛函达到极值。解决泛函极值问题的有力工具是变分法。所以下面再次列出变分法中的一些主要结果,可对照微分学中的结果来理解,以加深印象及理解。5.1变分法基础回顾如果对某一类函数中的每一个函数,有一个实数值与之相对应,则称为依赖于函数的泛函,记为简单来说,泛函是以函数为自变量的函数。1、泛函:相关的定义:若对任给的,存在当时,就有则称在处是连续的。2、泛函的连续性:满足下面条件的泛函称为线性泛函齐次性:叠加性:这里是实数,和是函数空间中

2、的函数。3、线性泛函:4、自变量函数的变分:自变量函数的变分是指同属于函数类中两个函数、之差这里,t看作为参数。当为一维函数时,可用图5-1来表示。图5-1自变量函数的变分这里,是的线性泛函,若时,有,则称是泛函的变分。是的线性主部。当自变量函数有变分时,泛函的增量为5、泛函的变分:6、泛函的极值:若存在,对满足的一切X,具有同一符号,则称在处有极值。定理:在处有极值的必要条件是对于所有容许的增量函数(自变量的变分),泛函在处的变分为零为了判别是极大还是极小,要计算二阶变分。但在实际问题中根据问题的性质容易判别是

3、极大还是极小,故一般不计算。5.2无约束条件的泛函极值问题5.2.1泛函的自变量函数为标量函数的情况为简单起见,先讨论自变量函数为标量函数(一维)的情况。我们要寻求极值曲线,使下面的性能泛函取极值(5-1)于是泛函J的增量可计算如下(以下将*号省去)上式中是高阶项。为此,让自变量函数、在极值曲线、附近发生微小变分、,即(泰勒级数展开)根据定义,泛函的变分是的线性主部,即对上式第二项作分部积分,按公式可得(5-2)J取极值的必要条件是等于零。因是任意的,要使(5-2)中第一项(积分项)为零,必有(5-3)上式称为欧

4、拉——拉格朗日方程。(5-2)式中第二项为零的条件要分两种情况来讨论:1、固定端点的情况这时,它们不发生变化,所以。而(5-2)中第二项可写成当时,(5-4)式自然为零。(5-4)2、自由端点的情况这时和可以发生化,,而且可以独立地变化。于是要使(5-2)中第二项为零,由(5-4)式可得(5-6)(5-5)因为这里讨论是标量函数的情况,和也是标量,且是任意的,故(5-5)、(5-6)可化为(5-7)、(5-8)称为横截条件。(5-8)(5-7)当边界条件全部给定(即固定端点)时,不需要这些横截条件。当给定时,不要

5、(5-8)。当给定时,不要(5-7)。5.2.2泛函的自变量函数为向量函数的情况现在,将上面对是标量函数时所得到的公式推广到是n维向量函数的情况。这时,性能泛函为(5-9)(5-10)式中向量欧拉——拉格朗日方程为(5-11)式中泛函变分由(5-2)式改为(分以下和两种情况:)横截条件为(自由端点情况)例5-1取极值的轨迹。求通过点(0,0)及(1,1)且使解即它的通解形式为式中:这是固定端点问题,相应的欧拉——拉格朗日方程为Sht—双曲正弦函数Cht—双曲余弦函数由初始条件,可得A=0。再由终端条件,可得,因而

6、极值轨迹为例5-2求使指标取极值的轨迹,并要求,但对没有限制。解即常数于是是常数,则是时间的线性函数,令由可得,又终端是自由的,由式(5-7)可得横截条件为这是终端自由的情况。欧拉—拉格朗日方程为容易验证时,对应局部极小;时,,对应局部极大。由上式解得或。时的极值轨迹为;时的极值轨迹为。即5.3有约束条件的泛函极值——动态系统的最优控制问题前面讨论泛函极值问题时,对极值轨迹没有附加任何约束条件。但在动态系统最优控制问题中,极值轨迹必须满足系统的状态方程,也就是要受到状态方程的约束。考虑下列系统(5-13)这是综合

7、指标。我们要求出最优控制和满足状态方程的极值轨迹,使性能指标取极值。式中,为维状态向量,为维控制向量(这里假定不受限制.否则不能用变分法求解,而要用极小值原理或动态规划法求解)是n维连续可微的向量函数。性能指标如下:(5-14)在下面的讨论中,假定初始时刻和初始状态是给定的,终端则可能有几种情况。我们将就几种常见的情况来讨论,即给定,自由和自由,属于一个约束集。5.3.1终端时刻给定,终端状态自由(5-16)(5-15)与有约束条件的函数极值情况类似,引入待定的n维拉格朗日乘子向量函数将状态方程(5-13)写成等

8、式约束方程的形式与以前不同的是,在动态问题中拉格朗日乘子向量是时间函数。在最优控制中经常将称为伴随变量,协态(协状态向量)或共轭状态。引入后可作出下面的增广泛函(5-17)于是有约束条件的泛函的极值问题化为无约束条件的增广泛函的极值问题。(5-18)再引入一个标量函数它称为哈密顿(Hamilton)函数,在最优控制中起着重要的作用于是可写成(5-19)对上式积分号内第二项

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。