基于强化学习多机器人协作控制方法地研究

基于强化学习多机器人协作控制方法地研究

ID:43548865

大小:827.06 KB

页数:60页

时间:2019-10-10

基于强化学习多机器人协作控制方法地研究_第1页
基于强化学习多机器人协作控制方法地研究_第2页
基于强化学习多机器人协作控制方法地研究_第3页
基于强化学习多机器人协作控制方法地研究_第4页
基于强化学习多机器人协作控制方法地研究_第5页
资源描述:

《基于强化学习多机器人协作控制方法地研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、沈阳理工大学硕上学位论文摘要多机器人协作是研究机器人领域的一项重要课题。由于多机器人协作可以完成单机器人无法完成的工作,因此越来越多的学者专注于多机器人系统的研究。目前对于多机器人系统而言,外部环境复杂多变且其可能面临多种选择,若只提供相对的控制参数,多机器人之间将难以形成有效的协作,难免产牛资源浪费和冲突。为促进机器人有效协作和系统优化,研究学者更加注重了机器人自身的学习能力。强化学习算法是近儿年发展起来的一种重要的机器学习方法,它是机器人通过感知环境信息來学习系统的最优策略。机器人通过不断的试错和与环境的交互来改善自身行为,从而具有了自主学习的能力,可以有效地完成协

2、作。为此木文对基于强化学习的多机器人协作控制方法进行了深入研究,所做了工作如下:(1)系统分析了多机器人系统的概念和组织行为,釆用强化学习理论和方法,研究机器人的路径规划问题。通过试错-评价的在线学习,使机器人选择优化的路径从起点运动到冃标点,得到所需的机器人运动行为的规划规则,为进一步研究多机器人系统协作行为的控制方法奠定理论基础。(2)提出多机器人协作围捕的混合强化学习方法。将强化学习系统拆分为两个学习子系统-目标追踪子系统与目标围捕子系统,以解决复杂协作围捕问题,利用模糊逻辑来解决多机器人系统状态空间大的问题,同时引入启发式奖惩函数设计的思想,以提高机器人搜索FI

3、标的效率,采用黑板通信与基于协商和意愿强化的协调方法,解决机器人之间的行为冲突,通过面向对象编程技术的仿真试验验证了上述方法的有效性。关键词:多机器人系统,强化学习,路径规划,模糊Q学习,协作围捕AbstractMulti-robotcooperationisanimportantsubjectinthefieldofrobot,whichcanfinishtaskindividualrobotcan'tdo,somorescholarsresearchonrobotcooperation.Butformulti-robotsystem,ifonlycontrollin

4、gparametersareprovided,effectivecooperationwillbedifficultlyfinished,itisawasteofresource.Tomakemulti-robotcooperationeffectiveinthecomplexandunknownenvironment,researcherspaymoreattentiontothelearningabilityofmulti-robot,aimingtooptimizeperformanceandenhancetheabilityofrobotcooperationa

5、ndeffectivelycompletethetask.Reinforcementlearningdevelopedinrecentyearsisanimportantmachinelearningmethod・11isanoptimalstrategythroughtheperceptionofenvironmentalinformation.Robothasaself-learningabilitythroughconstanttrialanderror,andinteractionwiththeenvironmenttoimprovetheirbehavior.

6、Sothemainjobofthispaperisasfollows:(1)Thispapersystematicallyanalyzedtheconceptandorganizationalbehaviorofmulti-robotsystem,whichusesthereinforcementlearningalgorithmandresearchesonthepathplanning.Throughtrialanderrorandevaluationofonlinelearning,itmakestherobotmovefromthestartingpointto

7、thetargetpointbyselectingtheoptimalpathtoobtaintherequiredplanningrulesformotivebehavior,thuslaysthetheoreticalbasisforthefurtherstudycontrolmethodsoftcooperationbehaviorofmulti-robotsystem.(2)Amixedreinforcementlearningmethodofmulti-robotcooperationhuntingisproposedinthi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。