字符识别算法研究

ID：75608568

大小：8.97 MB

页数：62页

时间：2021-12-18

上传者：笑似︶ㄣ無奈

资源描述：

《字符识别算法研究》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

密级保密期限玄钾金季硕士研究生学位论文题目学号姓名专导学业产”币院自动化学院年月日密级保密期限烤玄钾雷李硕士研究生学位论文题目学号姓名专学导一、蟹汗卜﹄生币完年月日独创性或创新性声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名井戒日期二,尹、了关于论文使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。保密的学位论文在解密后遵守此规定本学位论文不属于保密范围,适用本授权书。本人签名日期”、只多—』边址一—导师签名日期一卫“二主`一一一孝列峨一一北京电人学学位论文字符识别算法研究习石摘弓数字图像处理和模式识别一直是计算机领域里受关注的话题,而且如何把人类的一些工作让计算机实现,更是大部分科学工作者追求的。字符识别就是这样一种工作,也是现在比较热门的应用,在很多领域都能应用到,例如手写识别,智能交通等等,对字符识别的研究仍有重要意义。本文就字符识别这一课题展开了研究和学习,主要工作如下首先,分析了从图像采集完成后,字符图像预处理每一步的重要性,介绍了预处理每一步的方法和效果,包括彩色图像灰度化,图像去噪,灰度图像二值化,字符分隔,图像细化,并用实现这些步骤,根据实验结果分析预处理每一步对最后识别效果的影响和优缺点其次,对识别方法进行研究,其中模板匹配法容易实现,文中用实现了两种模板匹配,一种是不需要特征提取的模板匹配,另一种是用字符与横向和竖向的线的穿过次数作为特征的字符识别,并将两种方法结合,提高识别效率,根据字符统计特征设计了一个数字字符的分类器最后,把上述步骤贯穿起来,用两种模板匹配识别方法实现了验证码的识别,用直接匹配的方法车牌号识别,通过这两种应用来比较和分析识别的效果,和每一个步骤对识别结果的影响,总结了图片的特点和识别步骤识别方法的选择。关键词字符识别图像预处理模板匹配匹配改进北京邮电人学学位论文卫,,,,,,,一,,,,,,,,,,,,,,,,,,, 一七京邮电大学学位论文目录第一章概述二,……研究背景……字符识别简介……,……研究的意义……本文的工作……第二章字符图像识别前的处理…,……字符图像的灰度化……源字符图像去噪……字符图像二值化……字符分割……投影法分割……连通域分割法……字符图像归一化……字符图像细化……,……本章小结……,……第三章字符识别方法……特征提取……模板匹配二,……,……不进行特征提取的模板匹配……特征提取后模板匹配……,……两种模板匹配结合的改进算法……,……字符统计特征分析法……神经网络识别法……木章小结……第四章字符识别应用……车牌识别……网页验证码的识别……本章小结……第五章总结……,…工作总结……,……论文的不足……,…… 北京邮电大学学位论文参考文献……,……附录……,……、……,……致谢……,……,……攻读硕士学位期间取得的学术成果……,…,…… 北京邮电人学学位论文第一章概述研究背景人类所接受到的信息中,以上是通过视觉得到的。所以图像是我们生活工作和科技发展中一种非常重要的信息来源,图像以数字形式进行处理和传输时,具有质量好、成本低、小型化和易于实现等优点,这种存储和传输格式己经成为该领域当前和未来的主要发展趋势。图像处理可以应用光学方法,也可以用用数字方法。光学图像处理方法己经有很长的历史,在激光全息技术出现后得到进一步发展。尽管光学处理理论日益完善,处理速度快,分辨率高,但处理精度不高,稳定性差,操作不便等,对各种所需的处理不如数字处理灵活。数字图像处理的优缺点刚好相反,它突出的优点都是灵活方便,改变软件程序即可改变处理方法,达到所求的处理效果,最大的缺点是处理速度慢【'。数字图像处理是指使用数字计算机来加工,处理图像。数字图像处理技术起源于世纪年代,当时通过海底电缆从英国伦敦到美国纽约传输了一幅照片,它采用了数字压缩的技术。而在年,美国的喷气推进实验室对航天探测器“徘徊者号”发回的几千张月球照片进行计算机处理后,得到了清晰逼真的图像,这标志着第三代计算机问世后数字图像处理的概念开始得到了应用,这是数字图像处理技术发展的重要里程碑。他们当时使用计算机以及其它设备,应用儿何校正,非线性校正,灰度变换,去噪声,变换和线性滤波等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机绘制出月球表面地图。数字图像处理将一幅图像变为另一幅经过修改改进的图像,目的是为了恢复退化图像的本来面目,改善人的视觉效果,突出图像中目标物的某些特征,提取目标物的特征参数等。数字图像处理随着计算机科学的发展形成了诸如图像分害、图像增强、图像复原、模式识别、图像压缩、图像传输等分支。通过分析和处理,可以力深我们对图像的理解,并从图像中获得更多的有用信息,并使相应需要的信息、得到应用。因此,图像处理帮助人们得到信息以图像方式传播时的有用信息部分,在人们的生活中起着日益重要的不可替代的作用。模式识别诞生于世纪年代,随着年代计算机的出现,年代人工智能的兴起,模式识别在世纪年代迅速发展成为一「学科。它所研究的理论和方法在很多科学和技术领域中得到了广泛的重视,推北京邮电大学学位论文动了人工智能系统的发展,扩大了计算机应用的可能性闭。模式识别是对表征事物或现象的各种形式的数值的、文字的和逻辑关系的信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程。它是信息科学和人工智能的重要组成部分。简单地说,模式被理解成取自世界有限部分的单一样本的被测量值的综合模式识别就是确定一个样本的类别属性,即把某一样本归属于多个类型中的某一个类型。几十年来模式识别研究取得了大量的成果,也实现了很多成功的应用。图像识别是模式识别中的重要组成部分,目前己经应用到监控系统人脸识别,门禁指纹识别,交通中的车牌号识别,系统加密等等。这些应用都是基于数字图像来获取,传播,分析信息。其中数字图像字符识别技术是图像处理和图像识别领域中的应用最广泛的一个重要研究方向,也是计算机应用领域中的热点之一,在日常生活和科研中具有十分重要的作用。目前许多电子产品触摸屏的手写字符输入设备和自动化识别管理系统等都需要精确的字符识别技术。通常情况下,文字字符识别包括联机识别和脱机识别,联机字符识别就是随着用户的手写的输入,实时的识别出相应的文字,转换成计算机可以识别和处理的数字信息本文主要针对的是脱机字符,字符图像的研究。字符识别简介本文研究的字符识别技术主要基于光学字符识别技术。光学字符识别助,简称通俗地说,是用计算机自动辨识印刷在纸上和人写在纸或介质上的文字。技术,是指电子设备例如扫描仪或数码相机检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。也就是对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版而信息的过程。光学文字识别技术可分为印刷体文字一识别和手写文字识别两大类,后者又可以分为联机手写体识别和脱机手写体识别。脱机手写体汉字识别是指对于汉字的识别不依赖于输入设备,识别是建立在对图象处理上的汉字识别。脱机手写体汉字识别允许汉字的书写和识别不同时进行,但是山于完全的建立在对图像数据的处理之上,可以利用的信息量很少,是字符识别领域内最困难、最具有挑战性的研究课题。联机手写体汉字识别是士斤山用户以二维时问序列的力一式将汉字点阵数据在线输入计算机,边输入边识别。由于联机手写体汉字识别有一个时间作为参照物,更加容易从中获得对于汉字识别十分重要的结构信息,因此识别的难度明显低于脱机手写体汉字识别。这也是目前联机手写汉字识别更加接近实用的原因之一。从识别的难度来看,多字符的印刷体识别难于单个文字的印刷体识别,手写体识别要难于印刷体识别脱机手写文字识别又要远远难于联机手写体识别。本文主要针对脱机字符识别展北京电大学学位论文开学习和研究。识别系统的任务很明确,它要转换影像,使图片、文字和表格等能够在电脑中直接被编辑和使用。从影像到数字结果的输出,须经过影像输入、影像前处理、文字特征抽取、比对识别、经人工校正将识别错的文字更正,最后输出数字结果。在学科上属于模式识别和人工智能的范畴应用上是一种文字信息处理系统中的高速自动输入方式。字符识别是新一代智能计算接口的重要组成部分,它涉及到计算机数字图像处理、模式识别、人工智能、模糊数学、组合数学、信息论、自然语言理解等学科,也涉及到语言文字学、心理学、生物学等,是综合性的科学技术。早在上一世纪至年代,世界各国就开始针对的研究。在研究的初期,人们多以文字识别方法研究为主,且识别的文字仅为至的数字。近二十年来,国内外对数字、英文符号、汉字及其他语言文字进行了广泛深入的研究,提出了许多行之有效的识别方法,应用软件也越来越丰富,并且有实用装置出现。光学字符识别方法一般是首先使识别设备通过训练学习样本,存储某一类型字符的特征,使这些特征成为识别系统自身的知识,然后再利用这些先验知识对输入图像进行判断,得到字符的识别结果。字符的特征不仅仅局限于平面上的点阵位置信息,在频率空间、投影空间,甚至语义空间,字符都有各自的特征。我国的数字识别研究起步较晚,从年代开始了它的研究工作,经过科研人员十多年的辛勤努力,印刷字符识别技术的发展和应用有了长足的进步,如今对印刷体识别已经是一门相对成熟的技术。在过去的数十年中,研究者根据识别字符所采用具体特征的不同便衍生出了不同的识别技术。通常根据不同的技术策略,识别方法可以分为如下三类基于统计特征的字符识别技术、基于结构特征的字符识别技术和基于神经网络的识别技术。基于模板匹配的方法。一般来说,模板匹配法比较简单,程序实现起来也比较容易,重要的就是把每个字符的模板做好。这种识别方法选取同一类字符中共有的、相对稳定的并且分类性能好的特征作为特征向量。常用的特征有字符二维平面的位置特征、字符在水平或者垂直方向投影的直方图特征、矩特征和字符经过频域变换或其它形式变换后的特征等。大量字符的统计特征经过提取、学习和分类形成关于字符模板知识,这些模板信息存储在识别系统中。未知图像在一识别时首先经过相同的处理,得到同样的统计特征,然后与系统存储的字符模板特征匹配比较,根据比较结果确定字符最终的分类,达到识别的目的。衡量匹配程度的指标常采用各种向量间的距离指标,例如欧式距离、街区距离等。由于英文字符结构简单,笔划清晰,采用统计特征己经完全能够胜任识别工作。常用北京邮电大学学位论文的英文字符识别特征有穿越特征、网格特征、等。基于结构统计特征的字符识别技术。相对于模板匹配法来说,为了提高识别率,可以通过字符的结构特征,来自定义可行的区分方法,这种识别方法可以根据字符各自的特征自定义不同的算法研究,研究方法比较广泛,识别速度比较快。字符不同,字符笔划的走向位置也不同,反映这种走向的单位叫做结构。例如字符“”,是一个竖笔划和弧度笔划组成,而字符“”则是左右两个斜直线笔划加一条直线笔划。根据识别策略的不同,结构的选择也有所不同。可以选择字根、笔划,也可以选择比笔划更小的笔段。提取出的结构又称作字符的子模式、部件、基元,所有基元按煦某种顺序排列起来就成了字符的特征。基于结构的字符识别实际上是将字符映射基元组成的结构空间进行识别。在进行识别工作的时候就可以对数字或者字母观察其结构组成特点,将某些具有相似特征或者具有的相同组成部件的字符归成一类,然后识别时先识别到这个类别,再从这个类别继续划分子类别识别,层层递进,这样可以降低计算量。基于神经网络的字符识别技术。神经网络法,是一种比较先进的方法,如果训练时间足够长,训练样本比较合适,它的识别率相对前两种方法而言要更高。但神经网络也有它自身的缺陷,所以神经网络法还有待于近一步的改善和发展。迄今为止,人类识别文字的能力远远胜于计算机,无论是变形的字符、模糊的字符,甚至是破损的字符,人类都能很好地识别。基于人工神经网络的字符识别技术的目的就是力图通过对人脑功能和结构的模拟来实现对字符的高效识别。经过近几年的迅速发展,人工神经网络在字符识别方面得到了广泛的应用。在系统中,人工神经网络主要充当分类器的功能。网络的输入是字符的特征向量,输出是字符的分类结果,即识别结果。由于识别策略的不同和对问题理解水平的限制,输入的特征向量所包含的信息常常是冗余的,甚至是矛盾的。经过反复学习。神经网络可以智能地将特征向量优化,去除冗余、矛盾的信息,强化类间的差异。其次,由于神经网络采用分布式的网络结构,本身具备可以并行的条件,可以加快大规模问题的求解速度。由于人工神经网络是对生物的神经网络的一种极端的简化,以及人们对大脑活动的认知还停留在初级阶段,人工神经网络在学习效率和算法收敛性等方面还存在很多待解决的问题。可以说是一种不确定的技术研究,高正确率是研究人员奋斗的目标,但的正确率只能无限接近而无法达到。因为与其相关联的因素太多了,例如书写者的习惯、文件印刷的质量、扫描仪的扫描能力、识别的方法……这些都会影响正确率。因此,产品除了需要有一个强有力的识别系统外,识别系统的操作方便性,识别一前准备工作中各个步骤中不同算法的采用,所提供的优化功能及方法,亦是决定识别效果好坏的重要因素。北京邮电大学学位论文字符识别处理的信息可分为两类一类是文字信息,处理的主要是用各国家、民族的文字如汉字、英文等书写或印刷的文本信息。目前印刷体和联机手写方面识别技术已趋向成熟,并推出了很多应用系统另一类是数据信息,主要是由阿拉伯数字及特殊符号组成的各种编号和统计数据,如邮政编码、统计报表、财务报表、银行票据等等。因此,字符的识别研究有着重大的现实意义,本文主要针对第二类数据信息作识别。字符识别的过程一般由如下过程组成研究对象的图像获取灰度化图像平滑二值化字符识别特征提取图像细化字符分割图一字符识别的流程本文对图像的获取不做研究,重点在于获得了数字图像形式的字符信息以后的处理和识别过程。字符识别的好坏跟每一个步骤都有重要的关系,每个步骤都有比较多优秀的算法,这些我们会在后面的章节作介绍。研究的意义目前字符识别,包括脱机字符识别和联机字符识别技术虽然都已经很成熟,而且已经应用到实际生活中,影响了人们的生活方式,但是字符识别研究的意义依然重大,识别效率的提高,这一直是研究者们追求的,而且识别越精确,代价也越大,工作量越多,时间消耗的更大,如何在计算成本和识别效率中间选择一个最佳平衡点,这也是一个难题。只有充分掌握了不同算法的差异、优缺点及适用范围,这样更好的针对不同情况选择合适的算法,优化字符识别的效率,更好的应用到系统中去,提高正确率。本文的工作首先从图像处理基础开始进行学习,重点学习研究能应用于字符识别的图像预处理,包括彩色图像灰度化,图像去噪,灰度图像二值化,字符分隔,图像细化,每一步都有其关键作用。文中分析字符图像预处理每一步的实现方法和作用,并且用来一一实现,然后根据实验结果来分析预处理的每一步北京山卜电大学学位论文的效果好坏及其作用。实现了对待识别的字符图像的预处理以后,对识别方法进行研究,识别可以从字符结构特征也就是模板匹配,字符统计特征,和神经网络法这三个方向出发,不同的算法需要的输入可能会不同,所需要的预处理步骤就不都一样了,计算量就不一样了。其中模板匹配法简单,可以不用对字符图像进行细化就直接与模板匹配,文中用实现了一种不需要细化和特征提取的直接与字符模板匹配的识别,也实现了一种用字符与横向和竖向的线的穿过次数作为特征的字符识别,并根据实验总结出识别方法的特点,然后将两种方法结合起来识别,提高了识别的正确率然后根据字符统计特征设计了数字字符的分类器。论文的最后把上述步骤结合起来实现了一套字符识别系统,可以用模板匹配的方法来实现验证码识别和车牌号识别,其中车牌号的识别和验证码有所区别,多了一步车牌定位的步骤,用通过边缘检测和二值图像的腐蚀操作、闭运算对采集到的车的图像进行处理,提取出车牌图像区域,然后就可以作为一般的字符一识别输入进行识别了。通过这两种应用来比较和分析字符识别的效果,和预处理中每一个步骤对识别结果的影响,预处理中和识别不同方法的选择对结果的影响,总结了图片的特点和识别步骤识别方法的选择。北京邮电大学学位论文第二章字符图像识别前的处理待识别的字符图像的预处理是指在对字符图像进行特征提取和识别前所进行的处理。预处理的主要目的是对一个给定的含有字符的图像,突出图像中与字符有关的某些信息,削弱或去除某些不需要的信息使它的结果对后面的识别来说比原始的字符图像更适合。预处理一般包括二值化、平滑、去噪、规范化和细化等。不同的识别方法,对预处理的要求有所差别。如结构识别方法,对字符的规范化预处理可以从简,甚至不要。而有的识别方法对细化要求很高,有的则不需要细化等。预处理是字符识别的重要一环,它可以把原始图像转换成识别器所能接受的形式二值图像,消除一些与类别无关的因素,如尺寸和位置的标准化,为识别减少计算量。由于一般都在预处理后的图像上进行分割、提取特征,因此如果预处理的结果不理想,往往会给后面的分割和识别环节带来无法纠正的错误。本章主要研究的是字符图像识别前的处理过程,具体步骤包括彩色图像灰度化,灰度图像去噪,灰度图二值化,字符图像归一化,字符图像细化,并且用实现并演示算法的处理结果。字符图像的灰度化现在我们接受到的图片信息都是以彩色图像形式传播的,可是彩色图像数据含量大,处理难度也比较大,一般都转换成灰度图像来降低工作量。彩色图像一般情况下是模式的数据是以一个三维数组的形式来存储图像数据,分别来表示、、的分量,彩色图像的像素点是山红色、绿色、蓝色三原色混合而成的,不同含量的、、组成不同的颜色,每一个记录单个像素的位数据单元可表示任意一种颜色。而灰度图是指只含亮度信息,不含色彩信息的图像。灰度化是指把含有亮度和色彩的彩色图像变换成灰度图像的过程,计算机视觉检测图像处理往往需要将彩色的图像转换为灰度图像来处理。一般都不直接处理彩色图像,文件所需存储量大,占用大量系统资源,不利于图像的快速处理。把图像灰度化以后,图像数据是以二维数组的形式存储数据〔勺,这样一来,就降低了进行图像处理的复杂度,降低了计算机的工作量。灰度图像与单色图像的区别是加上颜色深度的概念,单纯的看,灰度图也是黑白的,就像黑白电视显示的图像一样,但是点与点之间黑的程度是不一样的,这就是深度'】。一般灰度图在表示时将亮度值进行量化,通常将亮度分为级到,为最暗显示为黑色,为最亮显示为白色,每个像素仅由北京邮电大学学位论文一个位字节表示该像素的亮度值,只含有亮度信息,没有彩色息,所以所占用的空间也越小,处理速度更快。从系统的性能考虑,目前绝大多数字符识别系统在作图像处理时均采用不含彩色信息的灰度图像。在模型中,如果井二,则颜色、、表示一种黑白颜色,其中的值叫做灰度值。灰度化处理的方法主要有三种最大值法,平均值法和加权均值法。最大值法使、、的值等于三者中最大的一个作为该点的灰度,即灰度值溯,,,这种方法会形成亮度比较高的图像。平均值法用、、的值求出平均值作为该点的灰度,即灰度值十,这种方法会形成较为柔和的灰度图像。加权平均值法根据某种指标给、、赋予不同的权值,取、、的加权平均值作为该点的灰度,即灰度值,式中的、和分别为、、的权值。取不同的值,加权平均值法就会形成不同的灰度图像。研究表明人眼对绿色的敏感度最高,对红色的敏感度次之,对蓝色的敏感度最低,所以使将得到较合理的灰度图像。经验和实际应用中一般都选取,二,二,,能得到最合理的灰度图像。即采取如下公式计算灰度值灰度值一十,其中、、分别是原彩色图像每个像素的红、绿、蓝色彩分量值。图一彩色图像灰度化色彩的原图均值法求得的灰度。最大值法求得的灰度图加权均值法算得的值如图所示,用三种不同的灰度化计算方法得出的灰度图像,可以看出相互的区别,均值法比较柔和,最大值法得到的结果亮度比较大。可以根据自己的需要北京山“电人学学位论文选择灰度化方法,如果图片整体都比较暗,那么可以选择最大值法,一般情况下,我们都选择加权平均值法。源字符图像去噪现实生活中的图像通常都是带有噪声的,噪声主要分为两大类—高斯噪声和脉冲噪声。图像常常被这些噪声所污染。例如用摄像头采集图像或用数码相机拍照时,由于物理器件的特性和电子系统的原因,在图像上形成高斯噪声因外界环境的干扰,造成信号在某一点的剧烈突变而形成的脉冲噪声。为了对图像进行后续处理,顺利提取出字符图像信息,就需要对图像平滑去噪。图像去噪是去除图像中的干扰部分和噪声,提高信噪比,突出图像的期望区域,便于提取图像的特征作为目标识别的模式。提高了图像的质量,才能有效地进行图像识别,图像去噪是图像预处理中一项应用比较广泛的技术。图像去噪是根据噪声和信号在频域上分布的不同进行的【川。信号部分主要分布在低频区域,而噪声主要分布在高频区域,但是图像的细节也分布在高频区域,正是这一点增加了图像去噪的难度,使得图像处理的需求权衡和算法的选择变得比较重要。图像的低通滤波可以消除噪声,但是也会损失一部分边缘信息,不恰当的处理有可能造成信息部分的损失。图像去噪的方法从不同处理域的角度可以划分空间域和频域两种处理方法前者是在图像本身存在的二维空间里对其进行处理,主要的算法有均值滤波,高斯滤波,中值滤波等而后者则是图像频域滤波方法是用傅立叶变换将图像从空间域变换到频域,在图像的频域对图像进行滤波处理。本文的主题是字符识别,应用在验证码识别,手写字符图像识别等方面的字符源图像,一般都没有很干净的,需要经过去噪或者平滑预处理。本节就针对字符图像,选了应用最多的中值滤波进行研究。并且结合图像,用自己编写的滤波函数来平滑图像,实验来验证滤波器的滤波效果,并总结得出使用时应该注意的相关事项。年,针对离散数据平滑问题首先提出了中值滤波的概念`,其后,这种新的滤波思想很快就被引入到一些重要的数字信号处理领域,其中图像处理是主要的一个方面。中值滤波是当前应用最广泛的空间域非线性滤波技术,由于在实际运算过程中并不需要图像的统计特性,所以比较方便。中值滤波首先是被应用在一维信号处理技术中,后来被二维图像信号处理技术所引用【'。在一定的条件下,可以克服线性滤波器所带来的图像细节模糊,而且对滤除脉冲干扰及图像扫描噪声最为有效。它非常适用于一些线性滤波器无法胜任的数字图像处理的应用场合,但是随着窗口的增大,有效信号的损失也会增加。线性滤波器主北京邮匕大学学位论文要适合于去除高斯噪声,而中值滤波器则主要用于消除脉冲噪声,效果比线性滤波器要好得多。中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替。中值的定义如下假设有一组数据,,,,…,把这个数按值的大小顺序排列于下…厂,,,…·。一一宁式一百置广扩」当为奇数时,取第一行的值当为偶数时,取第二行的值,称为序列,,,…,的中值。我们把一个点的特定长度或形状的邻域称作窗口,在一维情形下,中值滤波器是一个含有奇数个像素的滑动窗口,窗口正中间那个像素的值用窗口内各像素值的中值代替。设输入序列为,任,为自然数集合或子集,窗口长度为,则滤波器输出为,其中任。例如有一个序列为,,,,则中值滤波为重新排序后的序列,,,,中间的值为。对于二维序列进行中值滤波时,滤波窗口也是二维的,但这种二维窗口可以有各种不同的形状,如线状、方形、圆形、十字形、圆环形等。`二维数据的中值滤波可以表示为一冷·,为滤波窗口。本文中值滤波算法的实现,采取的是方形窗口,从方形窗口中获得邻域的像素值,变换成一维数组,然后这些值按照大小排列,这样就转换成了一维的中值滤波,得到中值以后赋给邻域的原点。但是不管卜种形状,随着窗口的增大,有效信号的损失也会明显增加。因此,窗口的大小的选择以能兼顾去噪和保护图像边缘为佳,在实验中由于采用的源图像都是验证码一类尺寸比较小的图像,采用的方形窗口比较合适,如果窗口再大就会有更多损失。用实现的中值滤波器运行如下图所示图一中值滤波效果比较窗口时的滤波效果图窗口时的滤波效果图北京邮电少丈学学位论文左图是经过模板的中值滤波后的效果图,右图是经过模板的中值滤波后的效果图。可以看出中值滤波能有效地去除图像中变化比较显著,比较突出的图像干扰和噪声。对于例子中这幅图像来说中值滤波既能去除图像中的噪声线的干扰,又能适当保持字符信息。字符周围的干扰和噪声能消除,对于下一步提取单个字符信息起到了很大的帮助作用,而字符图像的背景部分,基本与原本的值变化不大。但是随着滤波模板大小的增加,较大的滤波模板也会造成图片细节或者边缘处的模糊。模板增大时,对于高斯噪声的抑制能力有所提高,但是边缘却变得相对较模糊对于一般的字符图像中的噪声来说,小的中值滤波模板就有很强的抑制能力,增大中值滤波模板没有必要。中值滤波对于突出的噪声是非常有效的。正如图中所示,明显的去除了干扰字符信息的细线部分。中值滤波器从总体上来说,因为有用信息占得面积比例毕竟比较大,所以能够较好地保留原图像中有用信息的跃变部分,图中的噪声基本上完全去除,图像边缘得到了较好的保护,而且噪声周边的图像很“干净”,不会在噪声的邻域造成模糊,高斯滤波也是相当于把噪声部分分摊给了邻域,而中值滤波是从根本上去除了噪声部分。它非常适用于一些线性滤波器无法胜任的数字图像处理的应用场合,但是对一些本身图像的有用部分细节多,特别是点、线,尖顶细节多的图像不宜采用中值滤波的方法。一般在字符识别的实际应用中,很多人会选择中值滤波,当然也有不少人会提出自己研究的改进后的方法。字符图像二值化通过闪值把数字灰度图像处理成二值,图像的过程,称为对数字图像的二值化。数字图像处理中,二值图像占有非常重要的地位,二值化后的图像每个象素点只用或者来表示,二值化能显著减小数据量,使图像变得简单,降低后续处理的复杂度。图像二值化有利于图像的进一步处理,能凸显出感兴趣的目标,很大程度上方便了图像的运算和处理识别。一般来说,当物体轮廓足以用来识别物体且周围环境可以适当地控制时,二值视觉系统是非常有用的'】。二值视觉系统的输入一般是灰度图像,选择合适的闻值,通常就能将图像变成二值图像,以便把物体从背景中分离出来,很有效的获得图像的信息部分。如果图像有用信息的灰度值落在某一区间内,并且背景的灰度值在这一区间之外,这样根据图像的灰度分布来选择闽值计算得到二值图像,二值图像可以用来计算特定任务中物体的几何和拓扑特性。二值化的方法「'一般分为三种全局闭值法、局部阂值法和动态闭值法。全局闽值法全局闽值法是指对整幅图像只用一个闽值来进行二值化`“】。北京邮电大学学位论文大多数全局闭值法都要构造灰度图像的直方图。首先求出各个灰度级所拥有的像素的数目,画出直方图,直方图中每个峰所对应的像素的集合都分别代表着不同的信息阶。然后根据某种判别式或准则来计算闭值,使得对信息有最优的划分。这种方法的根据是表示同一类信息的像素一般都具有相近的灰度值。局部闲值法局部阂值法是根据像素的灰度值,和像素周围点的局部灰度特性确定阐值的方法。局部阂值法常用的方法有灰度差直方图法、微分直方图法。局部闽值法由于考虑了各像素邻域内像素灰度值的相互关系,使得算法复杂度有所增加,但抗噪声能力和工作鲁棒性也有所增强。动态闭值法当阂值选择不仅取决于该像素阂值以及其周围各像素的灰度值,而且还和该像素的坐标位置有关时,称之为动态阂值法。动态阂值法是针对灰度图像中的每一个像素逐点进行闺值计算的,以当前点为中心选取一个适当的邻域模板,从这个模板中的像素灰度值中获得判断,来决定对当前点是置还是。所以这种方法的比较复杂,计算量比较大。对数字字符图像二值化,要求二值化后的图像能忠实的再现原数字,基本要求为'笔画中不出现空白点二值化的笔画基本保持原来文字的机构特征。本文采用的图像背景比较单一,图像灰度直方图明显呈现双峰分布,也就是背景部分集中在一个灰度值区域内,字符信息部分集中在一个灰度区域内,这时采用全局闭值进行图像分割一般可得到比较满意的结果,根据灰度直方图,选取中间范围内的闽值就能部分去除背景和干扰,留下字符信息。在字符识别中,二值图像一般由灰度图像生成,所有灰度值小于或者等于闻值的像素被判定为属于特定物体,像素值置为,也就是显示为一个黑点否则这些像素点被排除在物体区域以外,灰度值为,显示为白色,表示背景或者例外的物体区域。假设原始图像为,,根据图像选择合适的阂值,分割后的图像,三式一``,刃一,其中,就是选择的闷值,,表示图像中,力点的灰度值,灰度图像二值化的过程看似简单,但是闽值的选取也非常关键。阂值设置过大会保留过多噪声闽值设置过小会降低字符区域的分辨率,使非噪声信一号被视为噪声而滤掉。全局闻值的二值化算法是指在整幅图像中使用一个统一的闭值对灰度图像进行二值化。本文我们根据灰度直方图分布选择闽值,用全局闭值法对图像进行二值化处理,对于一般的字符图像识别来说已经足够。北京邮电大学学位论文毒谁真羲彝墓徽鬃囊篡奈妻弩黯落戮灌葵簇鑫誉馋簇羚咫一黔缨一严侃臀一︸佩撒腻戮粼鹭一嫩瘾丫哪矍臀渭势瞥嘴一甘己洲粉理理衬图一二值化的阎值选择二值化之前的源图像中值滤波后的灰度直方图闰值为的二值化结果闰值为的二值化结果可以看得出来,经过二值化处理后的图像,字符信息和背景部分就几乎完全分开了。此时的灰度直方图可以看出,灰度主要分布在明显的两个区域,背景颜色较浅,灰度值分布在大的那个区域,选择两个区域中间的一个值,就能较为理想的进行二值化。如果阂值选取的不合适,就本例来说比如图,如果选择的过大,那么小于这个值的点的像素值都要被置为,就把不是字符信息的部分给留下了,这时候,选取的阑值在两个分布区域之间,就能很好的留下字符部分,去除背景部分的干扰。字符分割字符分割是指从背景中将单个有意义的字符提取出来,以便于对单个字符进行逐个识别。字符分割部分是整个系统比较核心的部分,分割的好坏直接影响了分割出的单个字符所携带信息的完整性,影响单个字符的识别,从而影响整个系统的识别率。在有些情况下,字符和字符之间并不是那么容易区分,比如字符形变,有重叠,或者粘连在一起,一块图像区域是否是一个字符图像,这又必须通过某些特北京邮,匕大学学位论文征识别来确定,而识别又以分割为前提,这种情况下分割和识别是互相依赖的'“。根据分割和识别相结合的紧密程度,可以把字符分割算法'”分为三类根据图像分析,分割出一个图像的区域,这个区域可能包含一个字符,或者是多个字符、字符的一部分等等,进行识别,识别完之后再次优化重组。其效果好坏的评判标准就是分割出的子图是否具有一个字符该有的属性,例如高度、宽度等,以及与相邻子图的距离。根据模板库中模板匹配进行分割,分割和识别有一定的交互性。这种方法的评判标准是识别结果的可信度,甚至还包括词法,语法层面上的可信度。字符的整体识别。一般针对英文单词的识别,考虑到单词的整体识别都以词表为识别驱动的,在整体词法上寻求单词整体上的最佳的切分。如果将字符串的分割、识别和后处理作为个功能模块来看,图像分析分割算法仅仅实现了图像的分割,和识别、后处理模块独立而基于识别的分割算法则是融合了分割和识别,两者交互进行,分割完成,识别也就完成了整体优化方法更加入了后处理部分功能,以词表等作为驱动,指导分割识别模块工作的进行。本文研究的验一证码识别和车牌识别的字符分割不依赖于字符识别,两者可以独立进行,文中研究了如下两种识别方法。投影法分割给定一条直线,用垂直该直线的一簇等间距直线将一幅二值图像分割成若干条,每一条内像素值为的像素个数为该条二值图像在给定直线上的投影'。当给定直线为水平或垂直直线时,计算二值图像每一列或每一行上像素值为的像素数量,就得到了二值图像的水平和垂直投影。投影可以作为物体识别的一个特征,可以根据二值字符图像的投影特征进行图像分割。理想状态下检测出投影为的位置为字符的边界,这样能把单个字符分离出来,用于识别。本文在实验中,对图像的每一列均进行投影,也就是以上算法中所说的“一簇等间距直线”的间隔为,这样为了更加确切的了解图像的投影特性。可图一数字的投影原字符图像投影到横坐标上的图像如图所示,左图是原数字图像,右图是黑色像素点都投影到横坐标上的图片, 北京邮电大学学位论文可以看得出来,统计黑色像素点的分布,就可以选择合适的横坐标,切分每个字符,这时投影分割就依赖于前面图像去噪,如果噪声留在图像上,就会对投影特征产生干扰,不能成功分割出字符,或者是把不是字符的部分作为字符分割出来。同样也可以往纵坐标上投影,这样就可以切分出不同行。加恤卜丁刀匡。即,玩,肠确偏,巴,州俄滋娜玩扣`二图一横向投影原文字图像到纵坐标上的投影如图所示,原图是获取图像以后文档中截图,转换成的灰度图的字符图像,如果源图像质量够高,像图中那样的,可以不用经过图像去噪的处理,直接转化成二值图像计算投影。在实际应用中,要识别整篇的文字,可以先把文章图像横向投影,先把每一行的文字切割出来。…尸”叮,曰曰留”叭以弋口断曰合呛叹叹那口盆日舀乌伙叹扩一·一一斌…一图一投影分割法原文字图像纵向投影根据纵向投影切分出的单个字符如图所示,实现了文字的分行以后,可以再根据文字图像的纵向投影的特征,一识别出每一个文字字符的区域,然后切割出单个的字符。就像图示中实现了字符分割的“”,“”,“”,“”那样,总的来说,投影法适用于较为清晰、只包含数字和字母、倾斜度不太大的图像。对于很多其他复杂应用场合,例如倾斜的文字,或是有比较大而积污点导致文字连在一起,手写的连笔字等等,在这北京邮电大学学位论文些情况下,投影分割的方法经常从本质上失去意义。分割出的结果也不一定是最终的等待识别的字符图像,根据选择的算法的不同选择,还可能需要进行细化处理,如果使用模板匹配等识别方法的话,因为每个字符是以与模板相同的规格来表现的,匹配时选取的特征不同,有些特征跟黑色像素点的数量和比例可能有关,这就还需要进行归一化处理。连通域分割法上面所说的投影分割法对于倾斜字符是无效的,为了实现对倾斜字符的分割,我们选用连通域分割的方法来分割单个字符。字符图像的连通域是指在这个图像区域内,从任意一个像素点都可以到达另外任意一个像素点,并且经过的路径中的像素点都是此区域中的点。也就是说,同一个字符的每一个像素都与集合内的其他像素是连在一起的。二值图像的运算中的一种就是连通域的标一记,将属于某个物体的点做标一记,然后就可以根据这些点组成物体,就实现了物体和背景的分离。假设读入的图像矩阵式,己知像素,,如果存在一条从到的路径,且路径上的全部像素都包含在中,则称与是连通的卿。采用基于连通域的分割方法是利用了每个字符或字符的一部分构成连通域的特性,把这些连通域分割出来,也就分割出了字符。在字符识别中,每个字符的各个像素在理想状态下是全连通的,这样就可以使用标一记连通域的方法来对字符进行分割。在一副图像中找出连通成分是计算机视觉中最常见的运算之一。对连通域的定义涉及到像素的连通,像素的连通有四方向连通和八方向连通两种,四连通指的是同一像素在上、下、左、右四个方向有连通。八连通指的是同一像素在、下、左、右、左上角、左下角、右下角、右上角个方向有连通。在本文中我们采用的是八连通定义。经典的求连通域方法是连通域生一长法,使用的是递归算法,如下所示扫描图像,找到没有标记过的一个像素点,给它分配一个新的标一记,没有未标记过的点,则结束标记递归扫描该点的邻点,未标记的分配标记如果该连通域内点的邻点内没有为标记的点则停止此连通域的标记返回第步。北京邮电人学学位论文簇井一聋澎健归林了粼蘸豁雾箕寥笃甲嘿钊叫一感夕心舜获叙狐毒忽舜蛋翘季生藉涵天冬菇灵豪操橇雄淤谕殊酬渊此侧图一源图像和连通域法分割实验中,标一记的数字就是发现的第个连通域,递归扫描发现个连通域,就作为个字符分割出来,连通域分割法比投影法适用范围更广泛一些。使用上述算法可以分割出投影分割法所无法分割的图像,连通域分割法的特点是不受图像倾斜的影响,定位精确。但是它需要质量比较高的图像,也依赖于去噪的实现质量,否则会把噪声当做一个字符的连通域分割出来,当字符与噪声区域或字符之间有粘连的情况时,此时用连通区域法分割就很难将正确的字符分割出来。字符图像归一化归一化,有些地方也叫标准化,字符图像在特征提取前通常需要进行归一化处理,归一化有大小归一化,位置归一化,笔划粗细归一化。在实际系统中,一般只用到大小归一化和位置归一化。这一步是可选可不选的,截取了单个的字符以后,根据识别算法选取的不同,有些算法,比如说直接把字符与模板匹配的方法,就需要对单个的字符图像规范化,待识别的字符和选为模板的字符都是同一规格,刁一能做到匹配。通常在某些模板匹配算法或者特征提取之前,需要把文字尺寸变换成统一大小,全正文字的位置平移,文字笔画粗细变换等文字图形的规格化处理,这样做会产生两个问题,一是字符图像的缩放可能会增加一些干扰,二是图像缩放本身的运算量较大。可以采用一种新的处理方法来消除尺寸变化对特征值的影响【,首先根据原始字符图像提取特征,然后根据字符的大小对提取的特征进行变换,使之与字符的尺寸无关。算法如下估计字符的大小,如字符的高度或宽度,这个值可以在文本切分时获得。将它与标准样木的大小相比较,得到字符图像的放大倍数。在提取字符的特征之后,对所有的特征除以这个放大倍数。方向特征本身与尺寸无关,对于曲率的变换和宽度的变化,在特征提取时只分析他的变化趋势,即逐渐变大,变小或者基本不变等,而对其具体数值并不关心,因此不必再次进行修正。为了提高对字符大小估计的准确性,还要利用识别结果进行修正,最终得到不是规范化字符的特征,而是字符“规范化”的特征。北京邮电大学学位论文戈鲜黔…毖拼井井污图一字符归一化效果验证码原图中值滤波和二值化后的结果图字符分割出来的单个字符归一化后的字符如图所示,对源图像验证码图像进行了灰度化,中值滤波,二值化,然后字符分割以后得到单个的字母图像,为了模板匹配算法的需要,进行了归一化,本文中模板的大小采用。可以从图上的实验结果看出,进行归一化以后字符得到了拉伸,字符的粗细发生了变化,如果是斜体字的话,字符也会偏离原来形状,发生形变,相对应的特征也就发生了变化,图像细节会被放大,如果进行细化处理,就会留下不需要的毛刺。如果噪声在图像预处理后留下痕迹,那么干扰噪声也会相应的被放大,影响判断。如果要进行特征提取,那么就需要对提取的特征进行变换,消除字符的尺寸变换对特征带来的影响。字符图像细化细化处理是预处理中相当重要和关键的一环。它把二值图像的黑色区域缩成线条,细化处理的目的是搜索图像的骨架,去除图像上多余的像素,在不改变图像主要特征的前提下,减少图像的信息量,直到只留下区域的最基本信息,以便进一步分析和识别。细化处理结果的好坏,直接影响到识别的效果和质量。细化算法实际上是一种特殊的多次收缩的过程,可使连通的区域转化成一条连通的曲线,这些曲线段近似处于区域的中轴位置,能近似的表现区域的基本形状。虽然是多次收缩,但是端点不会被删除,所以保留了曲线形状,而且还不会影响区域的局部连通性。细化的要求如下〕连通区域必须细化成连通线结构,细化结果最少应该是连通,保留终止线的位置,细化结果应一该近似于中轴线,细化引起的附加突刺短分枝应该是最小的。细化结果应该保证连通性,这一点是最基本的要求,细化后连通线结构的数量等于原始图像中连通区域的数量细化后终止位置应该保持不变,细化可以通过迭代方式不断去除边界点来实现,重要的是在运算去除边界点过程中不要去除端点像素,因为这样会丢掉结构信息最后所得的线段应能最好地逼近原始区域的中线。一种常用的细化方法是在至少邻域内检查图像的每一点,剥去边界点。北京邮电大学学位论文一次剥去一层图像,直至区域被细化成一条线,这一过程是用迭代法实现的。本文实现的细化算法,用的是的窗口,用不同的窗口分别表示端点,交叉点,轮廓点等,对图像的每一个像素点一次用窗口函数检查,为了保持连通性或线末端位置,交叉点端点等保留,然后将单像素的轮廓点擦除。在每次迭代中,外层区域就是用这种方式削掉的。当迭代结果没有变化时,迭代过程结束,图像得到细化。迭代法细化将二值字符图像点阵逐层剥去轮廓边缘上的点,变成笔画宽度只有一个比特的文字骨架图像。在细化处理过程中,一方面,去除的像素太少,则不能充分有效地减少图像的信息量另一方面,去除的像素太多,特别是某些关键若被去除,则改变了原始图像的主要特征。因此,高质量的细化算法程序对图像识别有很大的实用价值。牛一州卫图一字符细化编写的细化算法对字母图像“”的细化结果编写的细化算法对数字图像“”的细化结果如图所示,是本文用编写的函数实现的对字符图像的细化,整体上基本表达了源图像的信息,而且都是一个像素的宽度。由于原字符图像的质量就不是很高,字母“”是将小图像放大,边缘不平滑,所以细化后的图像也不是很平滑。可以看到阿拉伯数字“”细化后的结果还较为理想,细化以后也不会有细节的丢失,还有端点也都得到了保留,基本表达了源图像的信息。细化算法不会删除端点,否则有可能会丢失重要的表现字符特征的信息部分。本章小结本章介绍并实现了字符图像识别前的一系列准备工作,其中第一步彩色图像灰度化将彩色图像的三维数据变成二维数据,大大减少了数据量和工作量,一般都选择加权均值算法算灰度值,如果图像整体偏暗,可以用最大值法,最大值法可以使图像变亮。中值法是目前应用最广泛的字符图像去噪方法,能有效的去除图片中突变的噪声,同时也是图像边缘保护的比较好的,但是没有一种算法是完美的,滤波次数过多,或者窗口过大,也会对字符图像造成一定的损失。如北京邮电大学学位论文果源图像比较千净,能直接提取出字符信息的话,可以不进行这一步操作,免得造成信息损失。现在的算法都要在识别前转换成二值图像,在的运算中二值图像只有,这两种数字,又一次大大减少了数据量,本文,根据灰度图像的直方图分布来选择闭值,用全局阂值法实现了字符图像的二值化。字符分割实现了投影分割法和连通域分割法,图像的投影能反映出值为的像素和值为的像素的分布的特性,有此可以判断出字符的区域并分割出来,但并不适合于字符倾斜,字符的投影之间有重复的图像,连通域分割法解决了这一问题,按连通域来分隔的时候,一个连通域看作一个字符。字符归一化也是可选的操作,能将字符转换成统一的大小。图像细化是把提取出的字符图像转化成一个像素宽度的图,便于识别算法中的特征统计和比较,对于部分识别算法来说,一定程度上简化了计算。北京邮匕人学学位论文第三章字符识别方法在过去的数十年中,研究者根据识别字符所采用具体特征的不同便衍生出了不同的识别技术。通常根据不同的技术策略,识别方法可以分为如下三类〕基于模板匹配的字符识别技术、基于统计特征的字符识别技术和基于神经网络的识别技术。本章主要介绍特征提取的方法,和一般作为字符特征来提取的特征种类,还对上述三种字符识别的方法进行理论研究,用实现模板匹配识别算法,理论和实验结合的方法分析对比识别算法,并结合了两种模板匹配的方法,提出一种改进的方法,提高识别正确率。特征提取对于有些算法来说,用一定的算法提取出图像特征,这是图像识别的关键步骤,图像特征提取的效果如何直接决定着图像识别的效果。如何从原始图像中提取具有较强表示能力的图像特征是智能图像处理的一个研究热点。选择的特征应具有以下特点选择的特征应有较好的稳定性,不受字符尺寸变化和形状变化的影响选出的一组特征,任何种字符可以有某些特征相同,但不能全部特征相同选出的特征应能较多地表征出字符的有用识别信息选出的特征抽取方法应能简单实现,使编程简单,计算时间缩短。其中,对于手写体字符,由于其字型千差万别,所选特征码的稳定性是特征提取的关键。可作为字符特征用来提取的特征种类颜色或灰度的统计特征提取颜色灰度直方图是实践中最常用的图像统计特征。设为图像的某一特征值为的像素的个数,事实上,直方图就是图像某一特征的概率分布。但是由于我们带识别的图像是二值图像的形式,所以这一特征对于字符识别来说,意义不是很大。纹理、边缘特征提取纹理特征是表示图像的另一种重要的视觉特征,纹理结构反映图像亮度的空间变化情况,具有局部与整体的自相似性,纹理是由纹理基元按某种确定性的规律或某种统计规律排列组成的,在纹理区域内各部分具有大致相同的结构。图像代数特征提取从组织图像数据的数据结构来看,图像可以表示为矩阵形式,灰度图像可用二阶矩阵来表示,彩色图像可用三阶矩阵来表示,代数特征反映的是图像的一种内在属性。从表示图像的矩阵中提取出的特征称为代数特征。图像代数特征提取是以存储图像数据的数据结构为基础,利用矩阵理论提取图像特征的一种方法。北京邮电大学学位论文图像变换系数特征提取对图像进行各种滤波变换如变换、傅里叶变换、小波变换等,可以将变换的系数作为图像的一种特征。变换系数特征可以看作是二次提取的特征,因为一般用于图像分类识别的特征并不是所有的变换系数,而是从变换系数中再提取具有更强表示能力的部分系数,也可以是变换系数的各种函数组合形式,如提取主成份、提取小波能量等。所以变换系数特征一般具有表示能力强、特征维数低等特点,但是特征的语义不直观、需要先对分类识别的图像进行某种变换。特征提取的方法一般有逐像素提取,骨架特征提取,垂直方向数据统计特征提取,点特征提取等方法。逐像素特征提取是对图像进行逐行逐列的扫描,当遇到黑色象素时取其特征值为,遇到白色象素时取其特征值为,这样当扫描结束以后就形成了一个维数与图像中象素点的个数相同的特征向量。骨架特征提取是把字符图像先细化,然后再逐个像素提取特征。骨架特征提取的方法对于线条粗细不同的字符有一定的适应性,但是图像一旦出现偏移就难以识别。垂直方向数据统计特征提取的算法是自左向右对图像进行逐列的扫描,统计每列黑色象素的个数,然后自上而下逐行扫描,统计每行黑色象素的个数,将统计结果作为字符的特征向量。点特征提取是一种分区域统计特征的方法,而且特征只有个。首先把字符平均分成份,统计每一份内黑色象素点的个数作为个特征然后统计水平方向中间两列和竖直方向中间两列的黑色象素点的个数作为个特征最后统计所有黑色象素点的个数作为第个特征。模板匹配模板匹配法是图像识别方法中最具代表性的方法之一,它是将从待识别的图像或图像区域中提取的若干特征量与模板相应的特征量逐个进行比较,计算它们之间规格化的互相关量,其中互相关量最大的一个就表示其间相似程度最高,可将图像归于相应的类'。模板匹配通常事先建立标准模板库,模板库中的标准模板通常是二值化后的数字模板表示背景,表示字符,并且每个字符的模板大小相同,匹配前通常将字符图像标准化为模板大小。目前对于一般的印刷体字符通常采用简单模板匹配的方法,简单模板匹配是将标准化后的数字字符图像与字符模板逐个匹配,求出其相似度。模板匹配可用于印刷体字符识别,在字符较规整时对字符图像的缺损、污迹有较强的抗干扰能力,且识别率较高。然而,通常情况下用于匹配的图像各自的北京邮电人学学位论文成像条件存在差异,会产生较大的噪声干扰,或者图像经预处理和标准化处理后,使得图像的灰度或像素点的位置发生改变。这样,要设计合理有效的模板就变得十分困难。有时候在、设计模板的时候,并不是简单地比较模板与图像或区域形状之间的相似性,而是根据各区域固有的特点,突出字符之间的差别,并将容易由处理引起的噪声和位移等因素都考虑进去,按照一些基于图像不变特性所涉及的特征量来构建模板。二值化后的字符如果笔画粗细相差很多,这会对识别结果也会产生较大的影响,换句话说,模板匹配对笔画的粗细没有良好的适应能力。对于一些很相似的字符,分割字符时字符中笔画的位置稍微的变化都会影响到识别结果,所以很难一次识别成功,需要对其进行二次识别,例如。和,和等。再次识别时,可以用到下面将要讲到的利用字符结构的方法,搜索字符的笔画,例如区分识别和。,可以搜索字符的右下角,如果多出一捺笔画则认为是,区分和则搜索字符的左边,有超出闭值宽度的一竖笔画则认为是。在模式识别的各种方法中,模板匹配是比较容易实现的一种,其算法简单,数学模型容易建立。在字符识别方面对于字体规范的字符是非常有效的,对字符图像的缺损、污迹有较强的抗干扰能力,但是对于字符的旋转、扭曲和变形,抵抗能力不强。模板匹配一般应用于印刷体字符识别、车牌识别等领域。不进行特征提取的模板匹配模板匹配法有两种一种是进行特征提取后与模板匹配,一种是不进行特征提取,直接将字符点阵与模板进行匹配。如果不进行特征提取,将输人的字符点阵直接与模板库做匹配的话,首先要将输入字符放大或缩小至库中模板同样尺寸,即经过大小归一化后才能匹配。我的实验中用的第一种模板匹配法不进行特征提取和细化,将库中模板定为固定大小。实现中用于匹配的相似度计算方法如下一·,一式一、、,八气艺乞,一艺艺欠,一在式中,为待识别标准化图像,为模板图像,,为字符图像的长和宽。越大,相似度越大,实现时比较与每一个模板计算的相似度,然后进行比较,最大的值对应的模板表示的字符作为识别结果。实验中制作的字符模板如下图所示北京邮电大学学位论文丙口。脚的民田丙“吐日。引朴哪川侧闰“`。河片巴口怂同圈囚国︺。洲父山”马日叭月日间。面、沁兮卜困氏两阵犷忿、。︺典间瓜件“下二。卜`﹃`,日、月﹄,`图一数字和大写字母的模板实验中采用的模板是自己制作的,用的字体,在画图里先依次写下每个字符,然后再利用已写好的字符分割的程序把这些字符依次分开,并相应的保存下来,作为模板。因为矩阵的很多运算是针对值为的点进行的,在二值图像中,像素值为的点代表白色像素点,为黑色像素点,所以在识别的过程中,将黑色点,也就是像素作为背景,在有些情况下就需要黑白像素点到的步骤。实验中模板大小统一是,程序创建模板时是依次读入这些模板,每个模板是一个二维的矩阵,用二值数据表示相应的字符,然后把这些二值数据写入数据库,存储时创建了一个具有格的数组格,每一格的数据作为一个字符的模板,保存下来。实验中的模板匹配不需要进行细化和特征提取步骤,直接将待测字符进行预处理,去除噪声,二值化,字符分割,再将图片背景转换成黑色,即像素值设置为,表达字符的部分设为白色,然后进行大小归一化,和模板一样,拉伸为大小的图片,最后将得到的二维矩阵和模板中每一格的数组依次进行匹配,此时用到了矩阵运算的计算两个矩阵的相关系数,相关系数最大的当选为识别结果。实验中字符分隔用迭代的方法,先分割出第一行,剩下的部分作为下一个循环的输入继续分割。第一行分割出来以后,同样用迭代的方法,先分割出第一个字符,识别,然后把剩下的继续作为输入图像,进行分割和识别。程序打开写字板新建一个文件来显示识别结果。北京邮电大学学位论文因厂斤泌工成弓下。。,“妞。列一认训一村目文铃若释编嵘粼瞬三式瓣、蚤蠢麟帮公熬孩澎、璐`气气铃勤奄属,`氯口爵撇羲参黔憾…赫赫飘畜三了了了穿工石粼磷滓鳗羹卖图一模板匹配的字符识别结果实验证明,对于印刷体,字体差别不是很大或者是写的比较标准整齐的手写字符图片,模板匹配有一定的实用性,简单易用。特征提取后模板匹配特征提取能相应的减少计算量,只把提取出的字符特征和模板的特征进行匹配即可。在这个实验中,提取字符图像细化以后的横向和纵向的穿过特性作为识别的特征。给定一个待识别的图像,可以是经过细化处理的字符骨架图像,也可以是没有细化的去除了噪声的二值图像,横向和纵向都以固定的间隔划线,然后依次记下穿过字符图像的次数,也就是交叉次数。事先收集好模板图像,提取出每个模板的穿过次数,以矩阵的形式存放,作为特征矩阵,提取完每个字符的特征以后,作为数据库保存下来。获取了待识别的单个字符图像以后,同样提取出穿越次数,载入模板数据,和模板的穿越次数矩阵,依次作比较,计算相关系数,相关系数最大的是识别结果。本文中用的是长和宽,等分成五分,不能等分的,取整数部分,在每一个等分位置计算穿越次数,每一次交叉,记为一次穿越,这样共有十个特征值。计算差别的方法,了尸上`'、`八门曰叭﹃礼,,`﹄︸﹄︼一阵一魏几几几几式一其中可以代表待识别的二值字符,为模板的特征矩阵,得到的差值矩阵,…“为两者相关性衡量的数,同理如式一所示,计算出和的相关系数,与每一个模板计算出的的平均值除以当前模板计算得到的,这个值乘以作为相关性衡量的值,最大的那个对应的模板表示识别结果。下图中展示的是实验时选取的作为模板的的图片是用的的字体的,和穿过次数特征的提取。北京邮电大学学位论文、护、︺,︺匕几肠妞臼士`几乃」`人`勺」几︵乙﹂图一数字的穿过次数计算作为模板的的图像计算得到穿过次数特征矩阵在上面图一中,计算的是经过去噪犷二值化和细化的二值数字图像。得到的矩阵是存放穿越次数特征的矩阵,第一行是横向穿过的次数,第二行是纵向的穿过次数。这个方法计算的特征,模板和待识别的字符就可以不用进行归一化处理,因为程序设计的每一次计算穿过次数的位置都是按照比例来的。对每一个标准字符细化以后,运用编写的穿过次数算法计算,特胜矩阵是一个的二位矩阵,读入每个字符的穿过特性,组成一个大的数组,然后用对矩阵的处理,把矩阵分成了多个数组格,每一格对应着一个字符的穿过特性矩阵。荞凑蘸黔攘瓣嚓瘾廊崛瓤涵…缈曝然舒一哎味澎对图一字符的去噪待识别的源图像,灰度化后经过次中值滤波去噪的效果图。灰度化后经过次中值滤波去噪的效果图。灰度化后经过次中值滤波去噪的效果图。北京邮电大学学位论文攀协滚…热爵图一中值滤波后字符细化用作为闰值二值化效果图进行了一次中值滤波后图像细化进行了两次中值滤波后细化结果进行了三次中值滤波后细化结果虽然穿过次数可以不用细化就计算,如果不进行细化操作,那么图像的粗细等因素的不同会影响穿过次数的结果,如果进行细化的步骤,那么细化以后有可能因为噪声的干扰,滤波造成的细节损失,这样细化后的图像有可能会与源图像有差别。如图所示,噪声和滤波操作影响了细化的正确性,对于图片本来噪声就比较多的图片,如果只进行了一次中值滤波,那么字符图像的边缘有噪声,而且边界不圆滑,这样细化后的图片毛刺很多,细化后的字符与原字符差别很大做了三次中值滤波的字符图片细化以后,造成细节的损失,也就是非字符信息部分的粘连,这样细化出来的结果与源字符图像也有较大的差距而滤波两次的图片差不多刚好可以代表源字符。所以在识别的过程中不能一味的追求去噪或是字符北京邮电大学学位论文识别的某一个步骤,而是要综合考虑结果和相互的影响。图一字符识别结果如图所示,是识别结果,实验中实现这个特征匹配的方法,两次中值滤波来去除图像的噪声,还是采用了先细化再提取特征矩阵。过这个也是比较适用于一些清晰标准,字形状没有太大形变的字符图像,虽然计算量减小,但是抗干扰能力差,对于手写等有形变得字符图像不适合,这种判断条件就显得比较简单和不可靠,不够精细。`两种模板匹配结合既然这两种模板匹配算法都有缺点,第一种容易受归一化的影响,但是不需要细化,第二种容易受细化步骤的影响,但是不需要归一化,这两个步骤都是各自方法里独有的,本文实现了一种方法,将这两种模板匹配结合起来,一起识别字符,就实现了两者的缺点互补。大致的流程如下输入字符直接匹特征匹配识别配识别比较两者结果是否一样比较最人相关系数与平均相关系数的比例,选择比例大的识别结果图一两种模板匹配结合的字识别流程北京邮,匕大学学位论文这种方法是用两种识别方法都分别计算一遍待识别字符和模板的相关系数,选取相关系数最大的分别作为两者的识别结果,然后检查这两种模板匹配识别得到的结果是否一致,如果一致,那么这个结果就作为最终的识别结果如果两种方法的识别结果不一致,那么开始比较。因为在本文中实现的模板匹配是依次计算待识别字符和每一个模板的相关系数,得到最大的相关系数的模板代表的字符是识别结果,这个方法多一步计算这个最大相关系数与相关系数的的平均值的比例,比例大的具有更好的相似性,作为最终的识别结果。这个方法把两种识别方法结合在一起,能将优缺点互补,在一定程度上提高了识别的正确率,代价是运算量变大了,识别效果将在第四章的实验里面证明。字符统计特征分析法字符统计特征分析法是根据字符的笔画和结构特征来识别字符的。统计特征提取方法是通过选取同一类字符中相对稳定的分类性能好的共有统计特征作为特征向量,包括字符的位置特征、笔画特征等等。字符经过频域变换或其它变换后得到统计特征,然后在大量样本中估计统计特征的分类情况,设定分类器,最后根据字符特征的进行分类判别。大量字符的统计特征经过提取和分类后形成关于字符原型知识,构成识别字符的标准。这种方法就没有必要使用上述大小归一化这一步骤了,而且归一化过程会不可避免的丢失有用的字符信息,造成图像的失真。那么,用字符统计特征的方法就避免了这一步的信息丢失,而且提高了识别速度。字母和阿拉伯数字,它们都是印刷体,结构固定,笔画规范。但是,汉字的笔画比较复杂,所以这种方法更适于对字母和数字的识别。字母和数字的结构在水平方向匕有三种类型左右对称,左大右小,左小右大在竖直方向上也有三种类型七下对称,上大下小,上小下大。再看笔画也有两大类直笔画和弧笔画。直笔画又可分为横笔画、竖笔画、斜笔画弧笔画是一条曲线段,可分为开弧笔画和闭弧笔画。所谓开弧笔画,指该弧笔画没有形成封闭环,如字母“”。而闭弧笔画则形成一个封闭的环,如数字“”。根据字符的这些特点,可以对字母和数字进行逐级的分类,形成一颗判定树,每个字符就是一个叶子。这种分析法不需要对分割得到的字符进行大小归一化,也不需要建立样本库,完全依据字符自身的结构特征进行逼近识别不需要对字符进行标准化,可以避免因字符缩放而造成的失真不需要将待识别字符与全部字符进行匹配识别,在识别速度上比模板匹配更快。但是另一方面结构分析法从字符的形状出发,因此对于字符形状规范的要求也更高。而且需要事先分析好每一个字符的结构特征,并充分并准确的分析和总结,提取出字符各方面的特点, 北京邮电大学学位论文以及几个字符之间的共性用来分类,耗费的时间长,对各方面要求比较高,识别计算量小,但是准备工作量大。例如对数字字符,,,,,,,,,来说,根据特征统计,本文规划设计了一套识别流程,如下图所示,图一统计特征数字识另流程首先检测出没有弧笔画的是,,,然后从字符的左边和右边开始搜索黑像素的点,两点之间同一水平线上有白色像素点的是,剩下有横线的是,剩下的一个就是了有弧笔画的数字中,也是从左到右检测黑色像素点,中间有封闭的白色区域的记为一个洞,中间有洞的是,,,,有一个的是,两个的是,洞在上方的是,在下方的是有直笔画并且在上方的是,直笔画在下方的是,剩下的是。经过如图所示的流程,就可以根据数字特点一层层判断出数字字符,每一个分支是一个特点,每一个叶子是一个数字,这样就实现了对数字特征的分类来识别,同理也可以对字母实现类似的分类。统计特征提取方法的缺点在于难以摆脱字体变形及噪声的影响,如果识别不规范的手写,那么上面的过程就失去了意义。字体变形对结构的影响几乎无规律可循,因而容易造成规则库的片面性。即使能够得到较为全面的规则库,也存在规则的灵活应用问题,这些问题严重影响系统性能。因此,仅靠模板的机械性匹配句法和规则的推理方法是远远不够的。神经网络识别法近年来,人工神经网络以其抗干扰、容错、自北京邮电人学学位沦文适应、自学习能力强、识别速度快等特点受到人们的广泛关注。国际著名的神经网络专家、第一个计算机公司的创始人和神经网络实现技术的研究领导人一给神经网络的定义是“神经网络是一个以有向图为拓扑结构的动态系统,它通过对连续或断续式的输入作状态响应而进行信息处理”。人工神经网络的研究最初是受生物神经系统启发的,那么,它就会有类似于生物神经的神经元。它是由最简单的人工神经元并联或者再加串连组成的。人们通常用图形来表示网络系统的输人到输出的转化关系。神经网络进行字符识别的基本原理就是利用神经网络的学习和一记忆功能,先让神经网络学习各个模式类别中的大量学习样本,以记住各模式类别中的样本特征,然后在识别待测样本时,神经网络会回忆起之前记住的各模式类别的特征并将他们逐个与样本特征相比较,从而确定样本所属的模式类别。人工神经元是对生物神经元的简化和模拟】,人工神经网络是由大量的人工神经元构成的非线性动力学系统,具有巨量并行性,存储分布性,高度非线性,自学习性以及自组织性等特点。神经网络不需要系统的先验知识,可以通过多个样本数据进行学习,以提高其模型的准确性。神经网络的推导过程严谨,物理概念清晰,通用性强,具有很好的分类性。根据现有的研究情况表明,用神经网络的方法进行字符识别是可行的,识别的正确率很高。但网络的训练比较麻烦,样本的选择很重要,需要大量的样本刁`能保证最终识别结果的正确。本章小结本章主要研究了特征提取的一些方法,可以用来识别的字符的特征,和三种字符识别的方法。根据数字字符特征设计了一个分类器来一识别数字,用实现了两种字符识别算法,模板匹配法理论上比较易于理解,实现起来也不复杂,但是直接匹配的计算需要把待识别字符和每一个模板匹配一遍,比较最相关的那一个,比较时的计算量算是比较大的,模板匹配对于印刷体字符和写的比较标准的手写输入的字符都有比较好的识别效果。另外一种方法用到了字符的穿过特性,将细化以后的字符图像,横向和竖向按比例划出五条线,记线和细化后的字符交叉的次数作为模板特征来匹配,此特征只是一个的矩阵,很大的减少了计算量,但是对于字符的形变等没有很好的适应性。每种字符识别方法都有其适用的范围和优缺点,没有一种是十全十美的。不管是上述哪种方法,都有不少具体实现的算法,由于字符识别现在发展的相对比较成熟,各个研究者提出的不同的算法很多,也都比较成功,值得进一步学习。二七京电大学学位论文第四章字符识别应用字符识别的应用现在已经比较广泛了,本章就两个热门应用验证码识别和车牌识别来验证字符识别算法,来展现用做的字符识别系统的识别效果,并加以分析和总结。车牌识别近几年,车牌识别系统作为智能交通的一个重要方向越来越受到重视。车牌识别系统可以应用于停车场管理系统、高速公路超速管理系统、城市十字路口的“电子警察”、小区车辆管理系统等各个领域,对国家的安全和发展有很大的作用。虽然目前已有一些车牌识别系统相关产品出现,但是对其算法的研究发展从没有停止,仍有许多学者在做着进一步的研究改进。随着我国经济的快速发展,人民生活水平的不断提高,私有车辆越来越多,交通需求量也越来越大,现有的交通基础设施建设速度远远比不上机动车辆和其他交通工具的增长速度,传统的人工管理方式已经越来越不能满足实际工作的需要。为快速、高效地对车辆进行管理和监控,实现交通管理的自动化、智能化,车牌自动识别技术在智能交通系统中己成为核心技术。车辆牌照识别系统是建设智能交通系统不可或缺的部分。基于图像处理的汽车牌照识别系统是通过引入数字摄像技术和计算机信息管理技术,通过对图像的采集和处理,获得更多的信息,从而达到更高的智能化管理程度。车牌识别比起验证码识别多了一步,就是图像的预处理中多了车牌定位。不过车牌识别的过程可以酌情选择是否需要滤波,一般拍摄到的车牌照片,只要不是车牌上本身的脏东西,车牌背景部分是单色的,不用进行滤波操作。车牌识别的步骤如下图所示车牌图像采灰度化边缘检测和集车牌定位模板匹配字字符分符识别二值化图一车牌识别的流程图北京邮电大学学位论文下面是实验中使用的用数码相机采集到的车的图像图一采集到的原图像图一图像灰度化处理图一采用算子进行边缘检测以后的结果边缘检测是车牌号提取里的重要步骤,因为车牌部分颜色变化明显,正是利用了车牌号的这一特点,边缘检测就是对像素值变化剧烈的部分敏感,所以边缘检测以后车牌部分能比较明显的显示出来。北京邮匕人学学位论文图一图像聚类、填充图像的结果用的矩阵对上述图一边缘检测得到的二值图形进行形态学的闭运算,用同样的的结构元素对边缘检测得到的图像先进行膨胀操作后进行腐蚀操作,相当于用这个矩阵元素去填充边缘检测后的图像,边缘变化多的地方,如车牌部分,就被填充了,大面积的边缘还是一条线。由图像可以看到,填充操作以后,车牌区域基木上成型了,接近长方形的形状,但是填充后的图像有很多干扰部分,需要进一步的处理。图一二值图像进行形态学腐蚀和去除小的连通域以后填充后的图像先用线性结构元,也就是矩阵仁〕进行几次腐蚀操作,去除了填充后图像的线条部分,然后图像就被分割成为很多个大小不一的连通域,为了减少计算次数,根据连通域的大小的分布,设定一个阂值,把连通域像素数目少于这个阂值的连通域都删除掉,剩下的就是如上图所示的部分了。通过观察,可以发现,车牌区域己经是接近方形的了,那么由于车牌部分像素的横坐标和纵坐标的值比较集中,我实验中还是采用了标记连通域的方法,娜个联通域内像素的横坐标组成一个一维数组,然后计算这个一维数组的均方差,当然矩形区域的像素的横坐标之间差别是最小的,所以,均方差最小的连通域就是车牌图像的区域。得到了车牌的区域,这个连通域的最大最小横坐标和纵坐标,对应着灰度化以后的图像,就能提取出车牌号的图像,实现车牌定位。」匕京邮电大学学位论文图一车牌定位后提取的灰度图像蔺碌奋于臀二哪哪缪矍瞥缨华…益挂瘪尧趣彝鬓淡认谈鑫图一车牌图像二值化因药卿。尽少赞哪禅哪巨丛里邂巍螂翩别州川图碍一去除小的连通域扭回矛乙主﹄尸︸国引训。叫粗峨·。叼抚。孙,。巴翅。握讯卿魏︸岌礁象诫澎以气一、夸鹭刻属,以神污日含新树一、擅演一产〕一二一三止琶三遴一攫一溯羚簇薪孺荔粼落下一侧一赫篇蕊蕊书一黔图一识别结果北京邮电大学学位论文实现车牌定位,提取出车牌图像以后,就可以作为和验证码类似的输入在进行识别步骤了,车牌图像也有干抚,主要是一些点,或者边缘的线的干扰,用去除小的连通域就可以。汽车牌照的字符一般有个,大部分车牌第一位是汉字,通常代表车辆所属省份,或是军种警别等有特定含义的字符简称,紧接其后的为字母与数字。车牌识别用的是如中所述的不用细化不进行特征提取的直接进行模板匹配的方法,但车牌字符的模板和验证码的模板集有所区别,模板库的合理建造是字符识别准确的关键之一。车牌字符识别与一般文字识别在于它的字符数有限,模板包括十个阿拉伯数字一,个大写英文字母除去和,以及相关的车牌用汉字京、沪、苏、台、港、澳、甲、乙、丙、使、领、学、试、境、消、边、警等。建立字符模板库比较方便,直接提取车牌上的字符和数字作为模板,因为车牌上的字体也都基本上一样,差别不大,所以在识别的时候用这种模板匹配已经足够识别出来。识别程序设计能够得以顺利完成,在很大程度上也是得利于这套软件,功能强大,它包括数值计算和一些矩阵运算比较方便图像的集散,并且计算结果可视化,这为编程调试和图像处理创造了一个便利的环境。数字图像是以矩阵的方式存在的,有很多对矩阵的操作能应用在字符识别的过程中,使字符识别更容易实现。网页验证码的识别随着互联网的迅速发展,越来越多的企业,学校,医院以及政府部门都融入到互联网的世界,我们的生活和工作也越来越依赖于互联网的存在。信息安全问题也日益增加,日渐突出,在此情况下,验证码应运而生。验证码是指包含有一串数字或其它字符的一幅图片,里面加上一些干扰象素例如干扰噪声点,线等。当今的验证码图片也以彩色图片居多,可且儿乎所有的验证码的原图都包含了不同的干扰信息,包括背景的干扰,数字的字体和颜色的变化等。因此为了精确定位提取出验证码图像中字符的位置,对这些字符信息的提取,需要对采集的验证码图像进行预处理。预处理占的作用非常重要,去除噪声对字符信息的干扰,二值化提取目标,去掉干扰背景信自、而又能保护好数字信息的完整性,对于整个识别来说非常关键。北京邮电大学学位论文季龚葬烈誉炎势撰瓣瑕加簇一片户月一仑夔加戏一蓄矜攀本奉肇锣黔维彝事哗粼参扮壬形颧图一直接匹配法识别验证码实例原验证码图像一次窗口的中值滤波灰度图二值化的结果连通域的数量和大小分布直接模板匹配验证码的识别结果上面是直接匹配法识别验证码实验,从如上所示的验证码图像可以看出,字符区域的附近布满了细线和渐变色的背景干扰因素,所以预处理的目标是去除这些点,线等的干扰,期望得到的图像是只保留字符信息的二值字符图像。经过两次对灰度图像的中值滤波,基本消除噪声。然后根据滤波后灰度图像的直方图的特点,选取了的阂值对图像进行二值化,刚好能去除背景部分。由于图像中还有几个黑点,再一次统计连通域的数量和大小,并用直方图显示出来,可以看到有个连通域,根据连通域的大小分布,以上的应该都是字符部分,以下的都是噪声,选择合适的阂值一都可以,认为闭值以下数量的连通域是噪声而不是字符,去除小于值的连通域,然后用投影法字符分割。由于第一个字母“”在进行了中值滤波去噪声处理和二值化后,丢失了部分信息,中间那一横更加短了,其余的噪声干扰,可以用删去小区域的连通域来去除。实验一`户用的直接匹配的识别方法,“”和“”正确识别出来了,而“”和“”都没能正确识别出来,和预期的差别有点远,因为“”和“”这两个字,不管是什么字体,都差别不太大,而实验中选的验证码的“”的字体和模板字体有较大的差别,中间的一横比模板中使用的字体的“”短很多,阿拉伯数字“”字体和模板字体之间的差别很大,所以证明了直接匹配的模板匹配算法对于字符的字体的适应性较差。北京邮电大学学位论文图一直接匹配法识别验证码实例上图也是直接匹配的方法来实现的字符识别识别,原验证码图像经过灰度化,中值滤波,二值化以后仍然有干扰,然后再根据连通域的大小分布,删去像素数量少于的连通域,就得到了干净的,字符图像。由图可以看到,由于本身截图获取的验证码图片大小就比较小,滤波等预处理操作,对照片造成了一些不可避免的信息损失,例如大写字母的第一个中间黑了,这是因为本来待处理的图片大小太小了,所以即使在中值滤波的时候选择的是最小的的窗口,由于噪声的干扰,所以滤波处理后,还是有细节信息的丢失,而且数字的上面部分也因为噪声干扰变得有了多余的毛刺,数字“”经字符分割以后的大小比较小,直接进行模板匹配需要大小归一化,放大成的大小,分割后的“”经过拉伸,干扰毛刺就被放大,导致最终的处理结果,使得识别成了字母“”,但是模板匹配对于字母“”和数字“”的识别效果比较满意,虽然有噪声干扰,但直接匹配的方法对部分不影响字符形状的噪声还是有一定的适应能力。以下是实验中,提取穿过次数作为模板特征,匹配特征来实现的验证码识别北京邮电大学学位论文图一穿过次数做特征匹配的验证码识别原验证码图像穿过次数的识别结果上图是单独用穿过次数作为特征来实现的验证码识别,就识别的结果来看,只要字符工整,没有太大形变,图像去噪等预处理后没有太多信息的丢失,去噪等预处理比较成功的情况下,这种方法计算量小,同时识别效果也是比较乐观的。对于与图一里同样的验证码,提取穿过次数的特征矩阵,然后进行模板匹配的识别结果图一穿过次数做特征匹配的识别结果由于原验证码图片比较小,滤波操作很容易造成细节的损失,所以在识别的各项操作一前,把验证码图像先放大,这样可以减少中值滤波损失的部分。根据识别结果可见,因为噪声的污染,放大图片的本身也会把噪声放大,所以滤波后还是在字母“”里留下了一定的干扰,这样,细化的结果就与本身的字符信息差别就更大了,造成误识别。但是提取穿过次数做特征,来进行特征的匹配能很好的识别出数字“”。可以通过两种识别的方法看到,这两种方法都各自有自己能适应的干扰和适应不了的干扰,而且互不相同,用节中所示的两种方法结合的识别方法再对这个验证码进行识别北京邮电大学学位论文生一藻鹭馨馨撇赢一洲鹰,一榔幕鬓戮劝泄落轰藻熟颧羹羹秦囊攀蒸瓢鬓纂攘图一用两种模板匹配法结合的验证码识别可以看到,虽然图片上仍然有干扰,但是两种方法结合的识别方法正确识别出了验证码,克服了两种方法分别识别的缺点,实现了优缺点互补,提高了识别的正确率,但是由于这种方法要把两种匹配都计算一遍,所以增加了计算量。。本章小结本章将第二章和第三章步骤综合起来,组成了一套字符识别系统,能用中所示的识别方法来实现验证码识别和车牌识别,通过这两个应用来验证字符识别的效果。验证码分别用直接匹配的方法,和通过提取穿过次数作为特征的模板匹配方法来识别,前一种识别方法容易受归一化的影响,后者容易受细化的影响。实验证明,中介绍的将两种模板匹配识别方法结合起来的改进算法,在一定程度上提高了识别的正确率,克服了噪声对细化和归一化的影响。车牌识别的不同之处和关键点在于如何从一张原始的车的照片中提取出车牌部分,这个可以通过边缘检测以形态学运算来实现,形态学运算对于图像处理方面也有很大的作用。提取出车牌号部分以后就可以做类似于验证码识别的处理步骤了,由于车牌字符字体比较统一,用直接匹配的方法就可以得到很好的效果。验证码识别里比较重要的要考虑的是如何去除噪声,背景的影响,成功的提取出只包含字符的信息,实验证明,完全去除干扰是不现实的,预处理后的图像,字符信息多少都会有所损失,影响到识别的效果,所以如何做到两全其美,既能比较好的去除噪声,又能使识别算法对于与处理后的损失有一定的适应能力并提高识别率是下一步的研究方向。 J匕京邮电大学学位论文第五章结论与展望工作总结本文完成了字符识别的整个过程,实现了包括源字符图像的预处理,使采集到的待识别图片能作为识别步骤的直接输入,然后实现字符识别算法,组成一套字符识别系统。用编写的用户界面如下二然添磁戴奎滋月盆盗匹哭一甲—一一一嗜二谧捷娜竺碧沪、魏毅识射一浅影分袄穿过欢数努蒸丹赞赘熟一飞如嫂瑰定杰熟一燕蒸、杰氮蕊、、热攀珍攀笋毅点一点点点形粤硒…不吏塞禅凳魏寡毛图一实现的字符识别系统的用户界面这个系统能应用于验证码识别和车牌识别,并能根据最终应用的识别结果来分析和总结算法特点,各个步骤之间的联系和影响。分步来说,本文主要完成了三个部分的工作通常获取的字符图像都是彩色的,可能会被噪声污染不适合直接识别,本文先研究了字符图像预处理的算法,也就是把获取到的源图像变成能直接识别的数据,包括彩色图像灰度化,图像去噪,灰度图像二值化,字符分隔,单个字符图像归一化图像细化这几个步骤,先进行理论研究,然后用来实现这些步骤,理论和实验相结合,进一步说明预处理的每个步骤的作用和相互之间的作用联系,并根据结果的差别分析可能对后续操作的影响。在得到了可直接作为识别输入的信息以后,对识别方法进行研究。文中用实现了一种不需要细化不用特征提取的模板匹配,实验证明在字体北京邮电大学学位论文规范的情况下,对于手写输入和印刷体输入都有比较好的识别效果,原理易懂,由于模板匹配要把待识别的字符与模板库里每一个字符都要匹配一遍,而且这种方法匹配的是整个字符图像,数据量大,所以计算量也不算很小文中还用实现了一种提取字符与横向和竖向的线的穿过次数作为模板特征,然后进行模板匹配的字符识别,这种识别方法需要字符图像细化,由于图像经过预处理后,尤其是有噪声字符图像经过与处理后,由于噪声的干扰,和滤波操作的影响,使得字符信息带有干扰,那么细化操作又是比较容易受影响的一部操作,图像微小的变化有可能对细化结果产生比较大的影响,这时候再做穿过次数的计算,就会对识别结果有不好的影响,也就是一说,这种算法对于噪声干扰的适应能力比较差根据这两种模板匹配的方法各自的优缺点,将这两种方法结合起来一起进行识别,组成了一种改进的模板匹配算法,能互相弥补各自的缺点。掌握了识别前与处理的方法和识别方法以后,把上述步骤结合起来组成了一套字符识别系统,可以用模板匹配的方法来实现验一证码识别和车牌号识别。验证码的识别关键在于如何去除干扰,提取出验证码中包含的字符信息,噪声去除的不好,就会对识别效果有较大的影响。实验中先分别用两种模板匹配算法来做验证码识别,并根据结果比较算法的特点,然后用改进的两种模板匹配结合的方法对验证码进行识别,实验证明,这种改进的方法能在一定程度上提高识别的正确率,克服彼此的缺点。车牌号的识别和验证码有所区别,多了车牌定位的步骤,车牌定位可以用的边缘检测和二值图像的腐蚀操作、闭运算等操作对采集到的车的图像进行处理来实现,成功提取出车牌图像区域以后,就可以作为类似于验证码识别的输入进行识别了。车牌字体比较统一和整齐,所以用直接匹配就可以比较好的实现。论文的不足通过做这次学习研究的过程,我认识到不管是预处理还是字符识别,每种方法都有其优劣,理论和实践一定要相结合,并不是每一种理论在实践中都有预期的效果,而且理论上每种方法的特点,还得在具体的实验中做验证和比较,再根据实际情况和经验选择算法。理论知识上的学习还不够,很多学者自己提出的各式各样的识别算法值〔勺我学习,我做的仅仅是广大识别领域中的一小部分,还有更多的知识需要学习,希望可以有改进识别算法的思路。程序调试的过程中要耐心仔细的检查每一个错误,任何不经意的小失误错误都可能使结果大不相同。程序上也需要考虑的更完善一些,考虑的要周全一些,出现一些计算上或者输入上的错误,能返回信息提醒用户,重新选择输入, 北京邮电人学学位论文参数等。在编程实践上面,我还比较欠缺经验,希望以后通过练习,编程能力能提高。车牌识别和验证码识别都是比较容易实现的,因为都是英文字符和数字字符,希望经过进一步的学习,能掌握汉字识别的方法。北京邮电大学学位论文参考文献〔」陈书海,傅禄祥实用数字图像处理编著科学出版社〕汤国安,张有顺,刘咏梅遥感数字图像处理【」张宏林精通数字图像模式识别技术及工程实践一「刘海波,沈品,郭耸数字图像处理技术详解机械工业出版社「〕杨枝灵,王开十十数字图像获取处理及实践应用人民邮电出版社「吴小艳,王维庆,杨春祥,何山基于模板匹配的数字图像识别算法〕兵工自动化,「」贾姑,葛万成,陈康力基于轮廓结构和统计特征的字符识别研究叨沈阳师范人学学报,「贾少锐,李丽宏,安庆宾神经网络算法在字符识别中的应用「」科技情报开发与经济,一「〕夏德深,傅德胜现代图像处理技术与应用「,南京东南大学出版社,〔」章毓晋图像处理和分析〔」北京清华大学出版「」苏彦华一数字图像识别技术典型案例人民邮一巨出版社〔」刘鲁华,张延恒等译数字图像处理机械工业出版社年月「〕陈稿忠面向代理的验证码图片识别「」硕十沦文「〕贾云得机器视觉科学出版社「」匀数字图像处理原理与应用清华大学出版社一「〕陈大华数字图像处理清华大学出版社一「〕胡海艳,黄占雄一种基于止值图像的鲁棒字符特征提取方法福建电脑年第期一「」赵鹏对复杂背景中字符分隔方法的研究「〕亚庆学院学报,,一,,,卿一一,〔·,,一」几,·,,工一〔川李颖南京理大学〔硕十学位论文」「」陆宗琪,金登男图像处理编程清华大学出版社一〔〕胡小峰,赵辉图像处理与识别实用案例精选仁〕北京人民邮电出版社,一「〕李弼程,彭天强,彭波智能图像处理技术〕北京电子工业出版社,一北京邮电大学学位论文【」张铮杨文平石博强李海鹏程序设计与实例应用中国铁道出版社一张兆礼赵春辉梅晓丹现代图像处理技术及贴实现人民邮电出版社一「」十十数字图像处理技术详解刘海波沈品郭耸等编著机械工业出版社仁」杨淑莹图像模式识别技术实现「〕北京清华大学出版社,北京北京交通大学出版社,一「翟俊海,赵文秀,王熙照图像特征提取研究河北大学学报白然科学版,一「。〕边肇棋,张学工模式识别〔」北京清华大学出版社年「」徐海兰,刘彦婷,杨磊模式识别中三种字符识别的方法仁一匕京厂'播学院学报,一「赵学军余楚中乔进肖彤著联机方法与脱机方法相结合识别白由手写数字「〕重庆大学学报白然科学版年月一「」,仃,,,一一仁〕董玲娇车牌自动识别中的字符特征提取「」机电一程年月一〕,”守,,,,」刘直芳王云琼朱敏数字图像处理与分析清华大学出版社一,飞【,一「〕蒙峭缘,张远夏基于神经网络车牌字符识别的研究玉林师范洲'坑学报白然科学一」,,,,飞飞一,,「,」许明验证码的识别与反识别须十学位论文」南京理,一大学「」吕文敏车牌识别系统中图像的采集和定位问题研究「计算机与现代化年第期一〕王璐基于的车牌识别系统研究仁硕士学位论文上海交通大学北京电人学学位论文仁」宋寅卯李晓娟刘磊图像噪声滤波的研究方法及进展仁电脑开发与应用第卷第期一〔」姚锦绣郑胜林应用在图像处理教学中的探讨'一东「业大学学报第卷年月一北京邮电人学学位论文附录识别部分主要程序,改进的模板匹配方法显示图像,一,,建立一个存储结果的字符矩阵企一打开用于写入将误过,,,',载入模板计算模板里的字符数量,,'函数把字符分行第一行邵标记连通域一二二,记截取比每一个字符,一细化计算穿过次数北京邮电大学学位论文调用识别函数,,连接字符串〔」打印出字符,,,,识别完清空【飞打开以文件,显示,,二,模板和待识别字符计算相关系数,飞穿过次数计算模板匹配`,,一,,一,二 _IL京邮电大学学位论文【〕最大相关系数直接匹配的模板匹配,川【,,,一一一一一一卜,,,,,,厂,,卜,',,拼,, 北京邮电大学学位论文下,,二二下,,二二,,二厂,,二厂,,二件,,一卜,二,,二厂,,二厂,,二厂,,二厂,,下,,厂,,二厂,,汗,,二件,, 北京邮电少丈学学位论文二茶,,茶,,拼,'卜,,,'击厂,,拼,'拼,,厂,,厂,'下,,厂,,二厂,,扦,,厂,,,,拼,, 北京邮电大学学位论文厂,二二厂,'二二厂飞,二厂,,二'“挤,,二产,,二挤,,二厂,,二,,厂,,二产,,许,,许,,厂,,二,,,, 北京邮电大学学位论文件,,忏,,件,,下,,行切分函数一一,,一卜一,第一行矩阵一,,剩余的,乳, 北京邮电大学学位论文致谢首先要感谢我的导师,樊利民副教授,感谢他接受我作为他的研究生,给了我读研的机会,并且从入学开始到毕业,一直关心我的生活和学习上的成长。很有亲和力,友善的督促我们学习上的进步,给予方向上的引导,并且又很大的鼓励我们结合自我兴趣的发展,平易近人,开放民主,也会很热心的解决我们提出的问题,也对我的论文提出了宝贵的修改意见。然后要感谢同导师的高淑萍,李洁云,杨倩和张磊同学,我们在研究生学习期间,互相讨论,互相支持,互相监督,并对自己的论文提出意见,提供学习资料和帮助,非常感谢。还要感谢师兄师姐们,他们同样给我们指引了方向,给我们鼓励,让我们有信心。再感谢宿舍的同学和给我关心的朋友们,研究生期间是一段很美好的时光,有了大家所以难忘。最后特别感谢我的家人一直以来给我的关心,不论从生活上还是学习匕都非常支持我,他们的幸福是我前进的动力,他们的关心让我在温暖中学习和成长。北京邮匕人学学位论文攻读硕士学位期间取得的学术成果〕牛洁,樊利民图像去噪算法基于的实现计算机技术与发展,第卷,一

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 6 7 8 9 10 / 62



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

大家都在看

近期热门

字符识别算法研究

字符识别算法研究

最近更新

大家都在看

相关文章

相关标签