基于深度学习的印刷体汉字识别

基于深度学习的印刷体汉字识别

ID:37068868

大小:4.46 MB

页数:70页

时间:2019-05-16

基于深度学习的印刷体汉字识别_第1页
基于深度学习的印刷体汉字识别_第2页
基于深度学习的印刷体汉字识别_第3页
基于深度学习的印刷体汉字识别_第4页
基于深度学习的印刷体汉字识别_第5页
资源描述:

《基于深度学习的印刷体汉字识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要摘要随着互联网的发展以及深度学习的兴起,传统的光学字符识别面临着新技术的挑战。本文在仔细调研国内外研究现状和应用需求之后,分析了各种现行OCR的可行技术,设计了基于深度学习的印刷体汉子识别方法和基于深度学习汉字识别的软件应用。基于深度学习的印刷体汉字识别第一步是进行大规模的印刷体汉字样本的生成,通过图片生成和图片增强技术,本文生成了总计约2000万张的国家一级和二级字库汉字图片,构建了大规模的印刷体汉字样本库,样本的分辨率分为32x32和100x100两种,并且都标注好用于深度学习模型训练。在汉字图片库的基础上,本文设计和选取5种深度学习网络模型进行印刷体汉字识别的样本训练

2、调优和性能对比分析。样本分别采用32x32和100x100样本库,模型分别采用传统的LeNet5、基于改进的LeNet5-A、VGG7-A、ResNet-18、ResNet-50等网络进行训练,经综合分析,选取最优的ResNet-18模型进行印刷体汉字识别的系统应用软件集成。基于印刷体汉字识别深度学习模型的基础上,设计和构建了一个身份证文字识别的系统。针对于身份证图片的光学图像,分别进行了身份证图片分类识别,身份证图片预处理调整,身份证图片版面字符切割和字符识别,验证识别效果,最后得到了一个较高识别率的身份证证件识别系统。关键词:深度学习;卷积神经网络;LeNet5;VGGne

3、t;ResNet;身份证识别;印刷体汉字识别IABSTRACTABSTRACTWiththedevelopmentoftheInternetandtheriseofdeeplearning,traditionalopticalcharacterrecognition(OCR)technologyfacesnewchallenges.AftertheanalysisoftheavailabletechnologiesofOCRandtheapplicationrequirements,thispaperdesignamethodofChinesecharacterrecognit

4、ionbasedondeeplearningandasoftwareapplicationofChinesecharacterrecognitionbasedondeeplearning.Thefirststepistogeneratelarge-scaleprintedChinesecharacterdatasets.Throughthetechnologiesofimagegenerationandimageaugment,thispapergetsapproximately20millionChinesecharacterimages.Theseimagesare32x3

5、2and100x100resolutionandlabeledforthedeeplearningmodeltrain.Basedonthedatasetsbuildinthispaper,thispaperdesignsandselects5kindsofdeeplearningnetworkmodelsforsampletrainingtuningandperformancecomparativeanalysisofprintedChinesecharacterrecognition.Thesizeofthesamplesare32x32and100x100.Themode

6、lswhichusedinthetrainingareLeNet5,LeNet5-A,VGG7-A,ResNet-18andResNet-50.Basedontheresultsoftraining,thebestmodelResNet-18isintegratedintheChinesecharacterrecognitionapplicationsoftware.BasedonthedeeplearningmodelofprintedChinesecharacterrecognitioninthispaper,aChinesecharacterrecognitionsyst

7、emforIDcardswasdesigned.FortheimagesoftheIDcards,therearemanystepsoffunctionswasconstructedwhichincludeimageclassification,imagepre-processing,characterlayoutanalysisandcharacterrecognition.AllofthesemakeahighlyrecognitionrateIDcardidentificationsy

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。