文字识别算法_物理_自然科学_专业资料

文字识别算法_物理_自然科学_专业资料

ID:41704438

大小:118.29 KB

页数:9页

时间:2019-08-30

文字识别算法_物理_自然科学_专业资料_第1页
文字识别算法_物理_自然科学_专业资料_第2页
文字识别算法_物理_自然科学_专业资料_第3页
文字识别算法_物理_自然科学_专业资料_第4页
文字识别算法_物理_自然科学_专业资料_第5页
资源描述:

《文字识别算法_物理_自然科学_专业资料》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、题目图像分割技术学院计算机科学与技术班级计软1401学生兰俊锋学号20141214023文字识别是智能识别技术中的一个重要技术。文字具有便于信息保存和传递的优点,使信息在时间和空间上得以迅速扩散。在人们的日常生活中,在机关事务处理、工业以及商业交往中,需要识别文字的数量如同天文数字,但利用计算机识别的文字量却很少。最近几年,随着计算机技术、数学和图像技术的发展,文字识别的应用领域逐步扩大,目前较为活跃的应用包括数字识别,文字识别等。文字识别是指用计算机字典、高速地识别现在介质(如纸张等)上的数字、英文符号或汉字。文

2、字识别实际上就是解决文字的分类问题,一般通过特征及特征匹配的方法來进行处理。本文将从算法、应用两方面介绍文字识别技术,本文介绍的文字识别应用冇英文字母识别、车牌特殊文字识别、书写文字识别、特殊文字识别。文字是人类相互交流信息的重要工貝。社会发展进入信息时代,人们已不再停留在用自己的耳朵和眼睛去直接获得这些信息,而是使用计算机将文字自动的输入计算机,用计算机对他们进行处理,随时以各种方式满足人们的不同需要。因此,研究如何用计算机□动识别文字图像,解决文字信息门动输入计算机,并进行高速加工处理的问题已引起大家的广泛关注

3、。归一化算法一般作为一种图像的预处理技术,其i的是将采集到的原始图像转换成特征提取器所能接受的形式(灰度图像或二值图像),消除一些与类别无关的因索(噪声消除、归一化等)。从理论上讲,经过归一化后的骨架应该是宽度为一的中心线,但这是不可能的。不同的皎件设备和不同的算法得出的结果叮能不是唯一的,其结果与原图案的扭曲程度也是不〜样的,扭曲程度尽量的小应该是归一化算法追求的目的之一。既然预处理是为后续的特征提取和分类器设计服务的,那么预处理方法的选择就应该有利于特征的提取,以使分类变得简单。汽车牌照识别,在高速公路收费、电

4、了警察和治安卡口等系统中有重要的应用价值。作为图像识别的典型问题,汽车牌照识别的研究冇很长的历史,但因为实际路况的高度复杂性(如车速、光线、污染及变形等),冃前的性能还不能令人满意。1.文字识别过程概述一般來说,文字图像的识别过程主要由以下4个部分组成:①止确地分割文字图像区域;②止确地分离单个文字;③止确识别单个文字;④正确地连接单个文字。其屮①、④属于文字图像分析技术问题,③属于文字识别技术问题。关于②,由于仅从分割处理不能对其进行评价,通常采用文字识别地评价值来判断分离的止确性。单纯的文字识别是指经二值化处理

5、后的单个文字识别。1.1.文字识别系统的原理及组成文字图像的识别的原理如下图所示。图屮光电变换检测部分的主要功能,是对纸面上的文字进行光电转换,然后经模数转换成具有一定灰度的数字信号,送往其后的各部分进行处理和识别。常用的检测设备是扫描仪,CCD摄像头等。文字图像分割的目的就是根据文字图像的特征的视线文字图像区域的定位和分割,将真正的文字图形分割出来,以便后续进行识别,识别与处理部分的功能是将已分割出的文字图形信息加以区分,去除信号中的污点、空白等噪声,增强文字图像的信息。并根据一定的准则除掉一些非本质信号,对文字

6、的大小、位置和笔画粗细等进行规范化,以便简化判断部分的复杂性。特征提取部分是从整形和规范化的信号屮抽取反映字符本身的冇用信息,供识别部分进行识别。作为特征提取的内容是比较多的,可以是儿何特征,如文字线条的端点、折点和交点等。识别判断部分则是根据抽取的特征,运用一定的识别原理,对文字进行分类,确定其屈性,达到识别的目的,实际上判断部分就是一个分离器。识别系统学习部分的功能是生成计算机特征字典,学习根据已准备好的多个字样,抽出代表该字的特征,进行修改,按照字典的规定位置存放该特征。学习分为两种:一种是在人的参与下进行,

7、称为“冇教师”学习;一种由计算机自动进行,称为“无教师学习”。1.2.文字识别的方法文字识别是指用计算机字典、高速地识别现在介质(如纸张等)上的数字、英文符号或汉字。文字识别实际上就是解决文字的分类问题,一般通过特征及特征匹配的方法來进行处理。特征判别是通过文字类别(例如英文或汉字)的共同规则(如区域特征、四周边特征等)进行分类判别。它不需耍利用各种文字的具体知识,根据特征抽取的程度(知识的使用程度)分解到地使用结构分析的办法完成字符的识别。匹配的方法则是根据各国文字的知识(称为自动)采取按形式匹配的方法进行。按实

8、现的技术途径不同又可分为两种:一种是直接利用输入的二维平面图像与字典中记忆的图像进行全域匹配;另一种是只抽出部分图像与字典进行匹配。然后根据各部分形状及相对位置关系,与保存在字典屮的知识进行对照,从而识别出每一个具体的文字。前一种匹配方法适合于数字、英文符号一类的小字符集;后一种匹配方法适用于汉字一类的大字符集。1.3.边缘检测边缘(Edge)是指图像局部亮

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。