欢迎来到天天文库
浏览记录
ID:10739382
大小:50.00 KB
页数:3页
时间:2018-07-08
《基于改进bp的神经网络模型参考自适应控制》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于改进BP的神经网络模型参考自适应控制 摘要:由于传统BP算法存在收敛速度慢,容易陷入局部极小值等弊端,目前的BP优化算法又使得控制过程变得复杂,继而基于BP神经网络的模型参考自适应控制过程也存在实时性差,收敛性慢,精度不高等不足。现针对改进的BP算法和非线性系统的可逆性,分析设计了一种基于激励函数自寻优的BP网络模型参考自适应控制,并通过Matlab仿真结果表明,在满足控制精度的情况下控制系统中的辨识器和控制器效果都很理想。因此,对工程应用有很大的实际参考利用价值。 关键词:BP算法;模型参考自适应控制;激励函数;Matlab仿真;神经网络 引言 在现代实际
2、工业生产中,被控对象存在各种不确定性和时变性,因而使得工业控制过程变得繁琐复杂,针对线性时变系统或非线性系统的控制,人们不断的研究其解决方法,Narendra等人提出了神经网络控制和模型参考自适应控制相结合的神经网络模型参考自适应控制(NeuralNetoid函数,其函数表达式为: 上式中β称为Sigmoid函数的斜率参数,不同的β取值,引起曲线的弯曲程度不同,β越大,f(x)图形越陡峭。当斜率参数β接近无穷大时,Sigmoid函数将转化成简单的阶跃函数。但与阶跃函数不同,Sigmoid函数对应于0~1之间的一个连续取值区域,但
3、阶跃函数只对应0和1两个取值。 一般的三层前馈神经网络拓扑结构如图1所示。 输入向量为Xi=(Xl,X2,Xn)T,i=1,2,,n,n表示输入神经元的个数,隐含层的输出向量为yj=(Y1,y2,,ym),j=l,2,,m,输出层的输出向量为Ok=(Ol,O2.,ol),k=l,2,,l。每层之间的权值用oid函数为自变量的非线性函数,而Sigmoid函数存在饱和区,所以改进和优化激励函数对于BP算法的应用是至关重要的。通过实验发现,在函数表达式中增加一个控制参数η,可以控制激励函数的压缩程度。改进的激励函数形式如下: 上式描述的f(x)的定义域为(-&i
4、nfin;,+∞),值域为(0,1),函数也是单调的,满足激励函数的条件。 以往出现的改进BP算法学习过程中,η和β的赋值都是经验值,本文使得η是一个可以自适应的参数,就是通过判断网络不断学习过后的权值能否减小网络误差来自动的调整η的值,其调整方法为: 其中,al,E为网络误差,f指迭代次数。在误差信号反向传播时,自适应参数η是随着误差信号不断进行修正的。 此算法可以提高BP网络的收敛速度,同时也避免了陷入局部极小值。文中使其结合模型模型参考自适应控制明显提高了系统的整体控制效果,进一步验证了算法改进的实用性,
5、与传统BP算法相比,改进后的算法在实际运用中更具有意义。 二、神经网络模型参考自适应控制系统结构 典型的神经网络模型参考自适应控制系统结构如图2所示。 图2中NNC(NeuralNet和y分别为参考模型和被控对象的输出,ec是参考模型输出和被控对象输出之差,ei是被控对象输出和辨识器输出之差,NNC的权值修正目标是使ec达到系统设定值(理想值为零),NNI的目标也是使ei尽可能最小(理想值为零),且为NNC传递梯度信息。 神经网络辨识器NNI的训练误差表示为,其中,y(k)当前k时刻被控对象的输出数据,为下一时刻的预测输出数据。则辨识器的调整规则就是使误差Ei尽
6、可能小,Ei表示为: 神经网络模型参考自适应控制系统的控制目标在于使被控对象的输出y与参考模型的输出Ym渐近的匹配,即 其中,s为一个给定的小正数。 神经网络控制器NNC的训练则由误差ec=ym-y来训练,训练准则如上式(8),控制系统中神经网络辨识器和控制器的学习算法就采用改进后的BP算法。 在神经网络模型参考自适应控制系统的控制策略设计中,改进的BP算法能够在满足系统控制规律符合要求的情况下,使得神经网络模型参考自适应控制效果更好。虽然改进的BP算法是激励函数自寻优的自适应方法,不能够使神经网络辨识器NNI进行离线训练,但是快速的BP算法仍然可以使网络具有很
7、好的实时性。首先在线训练辨识器,待参数训练好以后,再进行控制器NNC的训练,最终可以保证被控对象的输出y很好的跟踪参考模型的输出Y。 三、仿真实例研究 3.1改进的BP算法验证 本文采用BP神经网络进行预测控制来验证改进算法的有效性。利用简单的一组样本训练集和样本目标集进行神经网络的训练,再给定一组输入样本数据,观测输出层输出数据和误差。分析样本数据设计BP神经网络结构为3个输入、2个输出、隐含层的神经元数目为8。网络学习次数为100次,目标误差设置为0.001。 使用MATLAB软件进行网络训练,传统BP算法的网络训练过程收敛情
此文档下载收益归作者所有