手写体汉字自动切分与识别

手写体汉字自动切分与识别

ID:37225722

大小:2.68 MB

页数:72页

时间:2019-05-19

手写体汉字自动切分与识别_第1页
手写体汉字自动切分与识别_第2页
手写体汉字自动切分与识别_第3页
手写体汉字自动切分与识别_第4页
手写体汉字自动切分与识别_第5页
资源描述:

《手写体汉字自动切分与识别》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、圭塑窒望盔堂堡主堂垡堡塞——手写体汉字自动切分与识别摘要i光学字符识别OCR(OpticalCharacterReader)㈣像处理与模式识别领域中古老而艰苣的研究内容。特别是离线手写体汉字识别技术离实用还有一定的距离,原因之一是因为目前字符识别系统主要是基于单字。对于手写体汉字切分的主要困难在于粘连或重叠的汉字,笔划粘连在一起,难于用投影或连通元的方法分开。另外,左右结构的字,如果两边写的较开,也容易被当成两个字或和其他宇错误的合并。因此字符切分是字符识别系统的重要组成部分。字符切分对提高整个系统的字符识别率具有重要意义。对数字。英文等字符的切分方法已有一些报道,对汉字切分

2、,尤其是手写体汉字切分的研究较少。j本文以“邮政信函自动分拣系统”为研究背景,以信函地址汉字为对象,研究了自由体手写汉字切分和识别。该课题将通过手写信函地址汉字识别,以作为邮政编码识别的辅助手段。论文实验采用由OVCS信函自动分拣机从实际分拣现场采集的真实民用信函上的二值化图象。本文主要研究内容包括:地址汉字区定位,书写线检测与去除,文字切分,文字识别。/本文用最小方差原理下的多步切分和提取笔划的动态规划法,对手写体汉字进行切分,能融}的处理粘连等汉字的切分,取得了较好的效果。主要工作和创新之处在于:(J)在标准Hough变换的基础上,提出一种改进的标准Hough变换算法,对

3、书写线进行定位,再用数学形态学的方法去除书写线,同时保留字符笔划上的点。改进算法通过存储空问复用减少了Hough变换的内存空间要求,并提高运算的速度;在去除信封地址书写线的应用中,结合实际,用限定搜索的角度范围,和提取特征点的方法,提高了检测书写线的速度,使对书写线的检测和去除达到了实用化水平。(2)根据手写体汉字的特点,在方差最小原理基础下,提出多步切分算法(粗分一细分一合并)和穿越算法。首先根据字段间问隔,用最小距离聚类的方法,得到5组粗分结果;从中选出晟接近理想的一种,用改变类间距离和穿越算法,对较宽的字段进行细分;最后将过细的分割部件合并成一个完整的字。对现场采集的3

4、000封信函进行切分,单字正确率达90.8%。(3)提出一种基于方向游程的笔划提取方法,通过建立笔划框,根据汉字的笔划结构知识对笔划框进行合并,形成候选框:将候选框作为节点,根据候选框的宽度和相互间距离,求出节点间合并的代价,用动态规划法得到对应全局最优的一组切分,作为最后的切分结果。用这种方法能较好的解决粘连宇的切分问题,对现场随机采集的2435封信函地址汉字切分的单字正确率达到91.5%。(4)探讨了信函自动分拣机上将地址汉字识别与邮政编码识别将相结合的实现方法,如通过建立地址频率库,来提高信函分拣的正确率。(5)探讨了在切分过程中适当利用一些识别信息,如上下文关系和语义

5、信息,来进一步的提高字符的切分和识别效果。j(/关键词:汉字切分,文字识别,直线检测,动态规划法,最小方差原理占塑奎望查堂堕主兰垡兰皇———————————————一AUTOMATICSEGMENTATION&RECOGNITIONOFHANDWRITTENCHINESECHARACTERABSTRACTOpticaICharacterReaderisofleofthemostoldandarduousresearchesinthefieldofimageprocessing&patternrecognition.Oneofthereasonswhytheoffiinehan

6、dwrittenChinesecharacterrecognitionhasadistancetorealapplicationisthatmostoftherecognitionsystemisbasedontherecognitionofisolatedcharacter.ThemaindifficultyinthesegmentationofhandwrittenChinesecharacteristhattouchedoroverlappedcharactersareverydifficulttoheseparate,whilecharacterswithstruct

7、ureofleftandrightpart,areliabletoberecognizedastwoindependentcharactersorbemergedwithothercharacter.Sothesegmentationisoneoftheimportantcomponentsincharacterrecognitionsystem.Ithadanimportantmeaningtogethigherrecognitionrateinthesystem.Manypapershadbeenp

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。