基于模糊强化学习的柔性结构控制方法研究

基于模糊强化学习的柔性结构控制方法研究

ID:34875830

大小:3.95 MB

页数:76页

时间:2019-03-13

基于模糊强化学习的柔性结构控制方法研究_第1页
基于模糊强化学习的柔性结构控制方法研究_第2页
基于模糊强化学习的柔性结构控制方法研究_第3页
基于模糊强化学习的柔性结构控制方法研究_第4页
基于模糊强化学习的柔性结构控制方法研究_第5页
资源描述:

《基于模糊强化学习的柔性结构控制方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、巧留,;爲聲毛?约我^專圍硕±学位论文胃磯.圓穿胃基于模糊强化学习的柔性结构控制方法研究作者姓名房东阳9学校导臟名、职疏保宏教授企业导酿名、取疏张录健研巧员串请学位类别工程硕±学校代码10701学学学学号号号号1304122191分类分类号分类号号号TP27密密密密级级级级公开公开西安电子科技大学硕士学位论文基于模糊强化学习的柔性结构控制方法研究作者姓名作者姓名:作者姓名:::房东阳领领领领域域域域::::控制工程学位类别学位类别:学位类别:::工程硕士学校导师姓名学校

2、导师姓名、学校导师姓名、、、职称职称职称:职称:::保宏教授企业导师姓名企业导师姓名、企业导师姓名、、、职称职称职称:职称:::张录健研究员学学学学院院院院::::机电工程学院提交日期提交日期:提交日期:::2015年11月AStudyofFlexibleStructureControlMethodBasedonFuzzyReinforcementlearningAthesissubmittedtoXIDIANUNIVERSITYinpartialfulfillmentoftherequirementsforthedegr

3、eeofMasterinControlEngineeringByFangDongyangSupervisor:BaoHongProfessorZhangLujianResearchFellowNovember2015西安电子科技大学学位论文独创性(或创新性)声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加yA标注和致谢中所罗列的内容W外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其

4、它教育机构的学位或证书而使用过的材料一。与我同工作的同事对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。一学位论文若有不实之处本人承担。,切法律责任商心0本人签名:《矣巧日期:西安电子科技大学关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权属于西安电子科技大学。学校有权保留送交论文的复印件,允许查阅、借阅论文;学校可W公布论文的全部或部分内容,允许采用影印、缩印或其它复制手段保存论文。同时本人保

5、证,结合学位论文研究成果完成的论文、发明专利等成果,署名单位为西安电子科技大学。保密的学位论文在年解密后适用本授权书。_本人签名;导师签名;辟《. ̄化乙0A0IS'wM日期;琳日期;摘要摘要随着深空探测、射电天文的不断发展,大型射电望远镜被广泛应用。新一代射电望远镜的口径也越来越大以获得更好的观测性能。但由于大天线的柔性、外界干扰等不利因素的存在,对天线控制系统提出了更高的指向精度、跟踪精度及鲁棒性等要求。本文以大天线控制问题为研究背景,将人工智能领域的强化学习作为柔性结构控制方法,在保证一定

6、跟踪精度的同时,抑制柔性振动。但是,传统的强化学习方法适于处理小规模的离散状态或离散动作学习任务而不能求解连续状态空间和连续动作空间的问题。针对此不足,本文把模糊推理作为函数逼近器引入到强化学习中,利用模糊推理的广泛逼近性,使得提出的模糊强化学习算法能够较好地处理大规模或连续空间问题。与此同时,将基于模糊强化学习算法的柔性结构控制应用于连续空间柔性尺模型的控制中进行验证。本文主要工作如下:(1)针对传统Q值查找表型强化学习算法在处理连续空间学习任务时所面临的“维数难”以及输出动作策略不连续问题,提出基于一型模糊推理的强化学

7、习算法。该算法首先将连续状态空间进行模糊划分;其次,以状态为模糊规则前件输入、动作及相应的Q值函数分量为规则后件输出构建模糊规则,通过模糊推理获得组合连续动作;最后由强化学习时间差分误差采用梯度下降法在线反向调节后件参数。(2)针对基于一型模糊推理的强化学习存在的鲁棒局限性,提出基于二型模糊推理的强化学习算法。以具有三维特性、能够更加贴切描述实际不确定性的二型模糊集合为基础的二型模糊系统,在处理干扰等不确定性问题时其相对于一型表现出更强的处理系统不确定性的能力。与此同时,考虑使用作为二型模糊集合特例的区间二型模糊集,结合其

8、能够极大简化广义上二型模糊集合的运算量的优势,最终设计出一种基于区间二型模糊推理的强化学习算法。该算法在实现较好处理连续空间问题的基础上,对噪声干扰的鲁棒性得到了进一步的加强。(3)通过对柔性尺模型的仿真控制验证本文所提两种模糊强化学习算法。结果表明,基于一型模糊强化学习算法的柔性结构控制,相比于基于查

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。