基于深度学习的自然场景文字检测方法研究

基于深度学习的自然场景文字检测方法研究

ID:35156855

大小:2.52 MB

页数:64页

时间:2019-03-20

基于深度学习的自然场景文字检测方法研究_第1页
基于深度学习的自然场景文字检测方法研究_第2页
基于深度学习的自然场景文字检测方法研究_第3页
基于深度学习的自然场景文字检测方法研究_第4页
基于深度学习的自然场景文字检测方法研究_第5页
资源描述:

《基于深度学习的自然场景文字检测方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、广东工业大学硕士学位论文(工学硕士)基于深度学习的自然场景文字检测方法研究胡胤二O一八年五月分类号:TP181学校代号:11845UDC:密级:学号:2111504036广东工业大学硕士学位论文(工学硕士)基于深度学习的自然场景文字检测方法研究胡胤指导教师姓名、职称:谢光汉副教授专业或领域名称:控制理论与控制工程学生所属学院:自动化学院论文答辩日期:2018年5月28日ADissertationSubmittedtoGuangdongUniversityofTechnologyfortheDegreeof

2、Master(MasterofEngineeringScience)ResearchOnTextDetectionMethodOfNaturalSceneBasedOnDeepLearningCandidate:HuYinSupervisor:AssociateProf.XieGuanghanMay2018SchoolofAutomationGuangdongUniversityofTechnologyGuangzhou,Guangdong,P.R.China,510006摘要摘要自然场景中的文字可以表达

3、高级的图像语义内容,它是人类理解自然场景图像的关键元素,在无人驾驶技术中,对道路的交通标志、路牌等字符图像的自动识别是急需要解决的关键技术,因此,对自然场景中的文字进行检测与识别的研究具有较强的实际应用价值。自然场景文字检测是自然场景光学字符识别(OCR)中非常重要的一个前处理环节,所有的文字识别图片都是来源于文字检测到的区域。在传统的光学字符识别中,处理的对象通常是分辨率较高的图像,具有背景相对简单、颜色单一并且排版规整的特点,因此文字检测和文字识别的难度较小。与传统的文字识别相比,自然场景文字检测任务

4、更为复杂也更具有挑战性:一方面,自然场景中的文字具有多样性,比如大小、颜色、字体、方向和排列组合方式都有可能不同;另一方面,自然场景中的背景复杂,比如光照强度、分辨率、噪声和物体遮挡等诸多不确定的因素,给自然场景中的文字检测带来非常大的困难。[1]本文首先介绍了基于最大稳定极值区域(MSER)的自然场景文字检测算法,基于最大稳定极值区域的算法在处理背景复杂的图像时不具有鲁棒性的缺陷,本文引入[2]一种基于深度学习的通用目标检测算法(SingleShotMultiboxDetector,SSD)对自然场景中

5、的文字进行检测。SSD无法对自然场景中的极端高宽比的文字进行检测。本文第三章和第四章针对SSD的这一缺陷进行了改进,提出了一种自然场景中水平方向文字检测的算法(Text-HD)和另一种自然场景中任意方向(多反向)文字检测的算法(Text-OD),两种算法都是通过一个单网络模型直接对目标进行分类和位置回归。Text-HD在defaultboxes(预选框)上设计了专门针对极端高宽比文字的尺度比,而且在Textbox层专门设计了“长”型(1*5)的卷积核,能够高效的对不同高宽比的自然场景中的水平方向文字进行检

6、测。Text-OD将Textbox层的“长”卷积改成3*5,同时用回归四边形的方法替代了水平文字检测的水平边界包围框的方法,对自然场景中的多方向文字进行了完美的匹配,而且在保证较高的检测率的同时也能达到较快的[3]检测速度,该算法除了非极大值抑制(NMS)处理以外没有其他的后处理操作。关键词:自然场景;文字检测;深度学习;卷积神经网络I广东工业大学硕士学位论文AbstractTextinnaturalscenescanexpressadvancedimagesemanticcontent.Itisakey

7、elementofhumanunderstandingofnaturalscenes.Therefore,theresearchoftextdetectionandtextrecognitionofnaturalscenesisofgreatsignificance.Naturalscenetextdetectionandrecognitiontechnologyhasawiderangeofapplicationprospectsinmanyfieldssuchasunmannedindustriala

8、utomation,intelligentsecurity,andhuman-machineinterconnectandmanyotherfields.Textdetectionofnaturalsceneisaveryimportantpre-processinglinkintheopticalcharacterrecognition(OCR)ofnaturalscenes.Alltextrecognitionimages

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。