基于深度学习和稀疏表示的手势识别研究

基于深度学习和稀疏表示的手势识别研究

ID:34662916

大小:1.52 MB

页数:71页

时间:2019-03-08

基于深度学习和稀疏表示的手势识别研究_第1页
基于深度学习和稀疏表示的手势识别研究_第2页
基于深度学习和稀疏表示的手势识别研究_第3页
基于深度学习和稀疏表示的手势识别研究_第4页
基于深度学习和稀疏表示的手势识别研究_第5页
资源描述:

《基于深度学习和稀疏表示的手势识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于深度学习和稀疏表示的手势识别研究作者姓名洪汉梯导师姓名、职称韩红副教授一级学科控制科学与工程二级学科模式识别与智能系统申请学位类别工学硕士提交毕业论文日期2014年11月学校代码10701学号1202121214分类TN82号TP18密级公开西安电子科技大学硕士学位论文基于深度学习和稀疏表示的手势识别研究作者姓名:洪汉梯一级学科:控制科学与工程二级学科:模式识别与智能系统学位类别:工学硕士指导教师姓名、职称:韩红副教授提交日期:2014年11月ResearchofGestureRecognitionBasedonDeepLearningandSparseRepresentation

2、AthesissubmittedtoXIDIANUNIVERSITYinpartialfulfillmentoftherequirementsforthedegreeofMasterinControlScienceandEngineeringByHongHantiSupervisor:A.P.HanHongNovember2014西安电子科技大学毕业论文独创性(或创新性)声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不

3、包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文若有不实之处,本人承担一切法律责任。本人签名:日期:西安电子科技大学关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属于西安电子科技大学。学校有权保留送交论文的复印件,允许查阅、借阅论文;学校可以公布论文的全部或部分内容,允许采用影印、缩印或其它复制手段保存论文。同时本人保证,获得学位后结合学位论文研究成果撰写的文章,署名单位为西安电子科技大学。保密的学

4、位论文在年解密后适用本授权书。本人签名:导师签名:日期:日期:摘要摘要随着计算机科学的发展,人机交互技术的研究成为了计算机技术研究领域的重要组成部分。而手势识别作为人体语言理解的一部分,有着非常重要的作用。一方面,它是虚拟现实人机交互的主要手段;另一方面,它又是聋哑人利用计算机与正常人交流的辅助工具。因此手势识别作为人机交互的重要手段,正在被越来越多的研究者所重视并研究。近年来,研究者越来越多的使用计算机视觉的方法进行手势识别并且取得了一定的效果。基于计算机视觉的手势识别方法是直接利用摄像机等图像采集设备输入手势,这样的方法根本不受设备约束的影响。但是到目前为止在手势识别方面还是存在着

5、许多方面的困难。对于静态手势识别,受背景环境的影响,怎样分割出准确的手形轮廓特征就是一个巨大的挑战。而在动态手势识别方面,怎样合理的跟踪手势并分割手势也是一个巨大的挑战。本文对基于视觉的手势识别进行了深入的研究,通过将图像处理,计算机视觉,机器学习,深度学习等知识进行融合,提出了一种有监督和无监督结合的静态手势识别方法和一种基于稀疏表示的动态手势识别方法。本文主要做了如下三部分工作:1.对于静态手势识别,通过引入深度学习的方法,首先通过无监督的稀疏自编码器对RGB图像小块的训练得到初始权值,将这些权值作为卷积核对原始的RGB图像进行卷积来获取图像的局部特征,再对卷积后的特诊进行一个池化

6、的过程来提取出图像的全局统计特征,同时降低特征的维度使识别结果更加快速和准确。此方法利用深度学习强大的自我特征学习功能来避免了手势图像的分割过程从而减小背景环境对识别效果的影响。而且还能降低特征维度使识别的速度和准确率都有所提高。2.由于能获取深度信息的摄像设备越来越多,如Kinect。深度图像与彩色图像相比,深度图像能够将物体表面的三维特征直接反应出来,而且还不受色度,阴影以及光照等因素的影响。通过获取手势的深度图,将深度图的信息和RGB图像的信息进行融合来提高识别率。3.对于动态手势识别,本文提出了一种基于稀疏表示的动态手势识别方法。首先直接通过三维的角点检测来提取出视频中所有的时

7、空兴趣点,以该点为中心建立一个立方体,再计算出该立方体的三维时空描述符,以该三维时空描述符作为视频在该点的特征。然后用这些三维时空描述符特征去训练一个超完备字典,通过超完备字典得到每个特征的稀疏表示。对稀疏表示系数进行一个池化的过程就可以得到每个视频的特征,最后进行分类识别。本方法不需要手势的分割过程,也不用复杂的数学建模过程,大大降低了动态手势识别的I西安电子科技大学硕士学位论文复杂度。上述研究成果具有一定的前瞻性和挑战性。本文在理论分析上取

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。