基于深度学习的自然场景文字检测与识别方法研究

基于深度学习的自然场景文字检测与识别方法研究

ID:37032600

大小:18.04 MB

页数:139页

时间:2019-05-15

基于深度学习的自然场景文字检测与识别方法研究_第1页
基于深度学习的自然场景文字检测与识别方法研究_第2页
基于深度学习的自然场景文字检测与识别方法研究_第3页
基于深度学习的自然场景文字检测与识别方法研究_第4页
基于深度学习的自然场景文字检测与识别方法研究_第5页
资源描述:

《基于深度学习的自然场景文字检测与识别方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号学号D20137746710487学校代码...專卡科技}寧博士学位论文基于深度学习的自然场景文字翻柳黯法研究I—学科专业:信息与通信工程指导教师:白翔教授:卿,期2018糊24日ADissertationSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofDoctorofPhilosophyinEnineeringgDeeLearnin-BasedMethodsforTextDetectpgionand

2、RecognitioninNaturalImagesPh.D.Candidate:BaoguangShiMajor:InformationandCommunicationEngineeringAdvisor:Prof.XiangBaiHuazhongUniversityofScienceandTechnologyWuhanHubeiP.R.China,,2018独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个

3、人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到,本声明的法律结果由本人承担。_学位论文作者签名:日期:年S月学位论文版权使用授权书、:本学位论文作者完全了解学校有关保留使用学位论文的规定,即学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。,保密口在年解密后适用本授权书。本文属于/不保密^""(请在以上

4、方框内打V)学位论文作者签名:欠/指导教师签名S如曰期年月K曰曰期:设年S月设曰华中科技大学博士学位论文摘要文字是人类文明的基石,也是现代社会信息交流最重要的媒介。场景文字是自然图像中的文字。它在日常生活中无处不在,名片、路牌、包装、车牌、店铺门面等物体都,携带文字并由文字埯述。对场景文字的识别是人类视觉的重要功能,也是计算机视觉的重要问题。它可以被用于大量的实际问题,如车牌识别、地理定位、单据识别、无人一驾驶、项基础设施无人超市等,是计算机视觉的。由于文字的重要性,对文档文字识别的研究早在几十年前就已经开始,积累了大量研究。然而,场

5、景文字在字体、颜色、尺度、排布、图像质量等方面高度复杂,挑战性远胜于文档文字。因此,尽管文档文字的识别技术已相对成熟,现有方法却难以应对自然场景文字的复杂性。近年来,深度学习的出现为计算机视觉提供了新的思路,并在多项基础问题中取得一了突破。本文基于深度学习算法:,围绕场景文字检测与识别问题开展系列的研究“”一⑴本文提出种快速任意方向文字检测方法。该方法基于原创的片段链接思想,一一:将文字行拆分成片段和链接两种元素片段是单词或文字行的小段;链接将属于同单词或文字行的相邻片段相连一。片段和链接通过个全卷积网络在多个尺度上密集地检一测,并根据几何规则组合得

6、到整词。该方法采用种与主流物体检测方法截然不同的思一IC15路,有效解决了细长文字检测这困扰学界多年的难题。它在标准数据集的结果20大幅超出了先前的方法,检测速度高达帧每秒,并且同时适用于英文和中文的检测,和现有方法相比具备多方面的优势。⑵本文提出一种端到端可训练的文字识别神经网络模型。该模型首次将卷积神经网络、循环神经网络、联结时序分类三者结合,能够直接从图片中识别出文字内容,并可以由图片和文字标注端到端地训练,极大地简化了传统方法中复杂的训练测试流程。、、该模型不仅识别准确,还具备模型参数少输入图片尺寸任意易训练、易部署等多项优势。⑶本文研究

7、了不规则文字的识别问题。不规则文字是非水平书写的文字,通常由侧面拍摄、、。它们在自然场景中广泛出现倾斜放置弯曲排列等因素导致,且难以识别。一本文提出一种新颖的矫正-识别神经网络模型。该模型通过种灵活的矫正机制,在识别前对输入图片进行自适应的矫正,能够纠正多种不规则的情形。矫正模型完全由识别模i'I华中科技大学博士学位论文7型所反向传递的梯度进行训练,无需额外的人工标注。该模型识别性能优异,在个主129流数据集的项指标中取得项最优。此外

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。