基于高斯混合模型的模仿学习算法的优化与评价

基于高斯混合模型的模仿学习算法的优化与评价

ID:23615561

大小:2.86 MB

页数:80页

时间:2018-11-09

基于高斯混合模型的模仿学习算法的优化与评价_第1页
基于高斯混合模型的模仿学习算法的优化与评价_第2页
基于高斯混合模型的模仿学习算法的优化与评价_第3页
基于高斯混合模型的模仿学习算法的优化与评价_第4页
基于高斯混合模型的模仿学习算法的优化与评价_第5页
资源描述:

《基于高斯混合模型的模仿学习算法的优化与评价》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中文图书分类号:TP18密级:公开UDC:621.3学校代码:10005硕士学位论文MASTERALDISSERTATION论文题目:基于高斯混合模型的模仿学习算法的优化与评价论文作者:郑逸加学科:控制科学与工程指导教师:于建均副教授论文提交日期:2017年5月UDC:621.3学校代码:10005中文图书分类号:TP18学号:S201402154密级:公开北京工业大学工学硕士学位论文题目:基于高斯混合模型的模仿学习算法的优化与评价英文题目:OPTIMIZATIONANDEVALUATIONOFIMITATION

2、LEARNINGALGORITHMBASEDONGAUSSIANMIXTUREMODEL论文作者:郑逸加学科专业:控制科学与工程研究方向:人工智能申请学位:工学硕士指导教师:于建均副教授所在单位:信息学部答辩日期:2017年5月授予学位单位:北京工业大学独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本

3、研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:郑逸加日期:2017年5月24日关于论文使用授权的说明本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后应遵守此规定)签名:郑逸加日期:2017年5月24日导师签名:于建均日期:2017年5月24日摘要摘要使机器人做出与人类相似的智能行为是机器人领域的研究热点,这就要求机器人具有学习的能力。模仿是

4、生物获得技能的一种学习方式,引入模仿学习机制能使机器人具备一定的智能能力。但由于模仿学习对示教信息依赖性较强,而示教信息存在偶然性,同时模仿学习算法中存在随机取值等问题,导致模仿学习的效果不稳定。同时,模仿学习的过程考量难以用单一的指标进行评价。因此,本文围绕机器人模仿学习算法的优化与模仿学习的方案决策展开研究。论文主要工作为:第一,单次示教下模仿学习算法优化:高斯混合模型(GaussianMixtureModel,GMM)具有很强的行为编码再现能力,因此,GMM被广泛应用于机器人模仿学习的表征。针对传统方法中随

5、机选取聚类初值导致的学习结果不稳定,表征参数分两步确定导致的学习效率偏低的问题。采用一种多中心聚类算法中的最大最小距离算法改进k-means算法,得到稳定的初始聚类中心,并基于贝叶斯信息准则通过遗传算法优化求解,同时获取GMM表征的四个重要参数。第二,多次示教下多约束模仿学习优化算法的构建与实现:模仿学习对示教数据依赖性较强,传统的单次示教过程中的失误会增加模仿学习的难度,严重时导致失败。针对这一问题,提出了一种基于多次示教的多约束模仿学习优化算法,将表征后的概率区间作为约束条件,求解多约束条件的交集,降低了示教

6、数据中劣质数据的表达概率,避免了由劣质数据造成的再现轨迹的波动。同时,引入了层次分析法,构建模仿学习评价模型,解决了定量评价模仿学习效果的问题。第三,基于集对分析的多约束模仿学习方案决策:针对示教次数对多次示教下的多约束模仿学习效果影响较大这一问题,本文应用集对分析法从贝叶斯信息准则、计算时间、拟合优度等角度出发,构建了多约束模仿学习方案决策模型,该模型能同时考虑影响因素的同一性、对立性,得到了可信度较高的多约束模仿学习方案。统计实验结果,提出一种具有指导性的多约束模仿学习示教次数的决策规律。实验结果表明,本文所

7、提优化算法和决策模型对基于高斯混合模型的模仿学习的学习精度与学习效率有较大的提高,有效避免了由示教中的误操作所导致的学习效果不佳或学习失败,使性能稳定,并且对于提升多次示教下的模仿学习效果具有一定的指导意义。关键词:人工智能;模仿学习;遗传算法;多约束优化;集对分析IAbstractAbstractTheresearchhotspotinthefieldofroboticsistomakerobotsbehavelikehumanswhichrequiretherobothastheabilitytolearn.

8、Imitationisawaythatlivingthingsacquireskills.Theintroductionofimitationlearningmechanismcanmaketherobothaveacertaindegreeofintelligence.However,imitationlearninghasstrongdependenceondemon

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。