基于深度学习的目标检测与分割算法研究

基于深度学习的目标检测与分割算法研究

ID:35067254

大小:6.14 MB

页数:78页

时间:2019-03-17

基于深度学习的目标检测与分割算法研究_第1页
基于深度学习的目标检测与分割算法研究_第2页
基于深度学习的目标检测与分割算法研究_第3页
基于深度学习的目标检测与分割算法研究_第4页
基于深度学习的目标检测与分割算法研究_第5页
资源描述:

《基于深度学习的目标检测与分割算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中文图书分类号:TP391密级:公开UDC:621.3学校代码:10005硕士学位论文MASTERALDISSERTATION论文题目:基于深度学习的目标检测与分割算法研究论文作者:王若辰学科:控制科学与工程指导教师:徐喆论文提交日期:2016-05UDC:621.3学校代码:10005中文图书分类号:TP391学号:S201302159密级:公开北京工业大学工学硕士学位论文题目:基于深度学习的目标检测与分割算法研究英文题目:RESERACHONIMAGETARGETDETECTIONANDSEGME

2、NTATIONALGORITHMBASEDONDEEPLEARNING论文作者:王若辰学科专业:控制科学与工程研究方向:检测技术与自动化装置申请学位:工学硕士指导教师:徐喆副教授所在单位:电子信息与控制工程学院答辩日期:2016年6月02日授予学位单位:北京工业大学独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构的学位或证书而使用过的材料

3、。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。关于论文使用授权的说明本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后应遵守此规定)摘要摘要近些年来,随着科技的进步,以深度学习为代表的人工智能技术被越来越多的运用在科研与工程的方方面面。自动驾驶、人机对话、基于内容的图像检索、人脸识别等等,人工智能技术在这些领域都

4、获得了广泛的应用。名噪一时的AlphaGo也是深度学习技术被实际应用的又一个案例。人工智能技术的来源是仿生,而人类绝大部分信息源自视觉。因此,图像识别技术是人工智能的一个极重要领域。如何理解场景,如何识别物体所属类别,是人工智能系统应用的关键问题之一。传统的图像识别算法,图像的特征提取与分类两步是分开进行的。这就使得人需要手工构建、选择针对目标的特征。这不但增大了人的工作量,而且在面临复杂陌生问题时,人往往无法设计出足够优秀的特征。并且最关键的,人设计出的特征往往是肤浅的,针对于诸如梯度、颜色、纹理等

5、某一方面的浅层特征。这就使得传统的图像识别算法有很大的局限性,性能提高空间有限。而近年来,随着硬件水平的提升,深度神经网络开始变得实用化了。其最大的特点在于特征提取与分类被整合到了一个单独的神经网咯之中。并且随着网络结构的加深,它可以提取到物体的深层高级别特征。这使得人工智能技术在近几年获得了跨越式发展。本文针对机器人以及无人车的等自然场景下的图像识别问题,研究主要基于深度学习算法,主要内容包括:(1)实现了一种快速的基于卷积神经网络的行人车辆场景检测模型。本文参考了全卷积神经网络、知识提取等前沿算法

6、,成功的提升了原有基于卷积神经网络的行人车辆检测模型的实时性,使其与识别精度能够达成平衡。在自动驾驶领域,能够实时的处理路况信息无疑是非常重要的,因此本章的工作也就具备了很强的实际意义。(2)提出了一种基于深度学习的类别分割至目标分割转化模型。基于深度神经网络的语义分割算法,可以有效的得到被识别场景的像素级别标签。但在面对粘连的同类物体时,语义分割算法无法有效的得到单个个体,这无疑大大限制了语义分割算法的应用范围。本文提出了一种基于深度神经网络与局部特征相结合的物体分割方案,可以有效的处理同类物体粘连

7、的问题,进而得到单个目标。(3)提出了一种基于深度神经网络的文字位置检测方法。在机器人面对自然场景时,往往需要提取其中的文字信息。但自然场景中的文字往往相互粘连,I北京工业大学工学硕士学位论文这造成了大量的漏检。本文通过使用残缺粘连的文字区域图片训练神经网络,可以使得神经网络在检测文字位置的同时,避免文字粘连所带来的漏检问题。在处理自然场景中的文字识别问题时,克服文字粘连问题无疑是很重要的。(4)基于深度学习的图像识别系统的实现:为了达成理论与工程的平衡,本文的实验均没有使用仿真工具。本文使用了当前流

8、行的开源程序库,与自行编写的代码相结合。由于全部代码可见并且没有版权问题,这使得本文的工作具备较强的工程性与实用价值。关键词:深度学习;卷积神经网络;场景识别;图像识别;图像分割IIAbstractAbstractInrecentyears,withtheimprovementupontechnology,artificialintelligencetechnologyrepresentedbydeeplearninghasbeenincreasingl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。