基于粗糙集的车牌字符特征提取方法探讨

基于粗糙集的车牌字符特征提取方法探讨

ID:33440011

大小:62.12 KB

页数:9页

时间:2019-02-26

基于粗糙集的车牌字符特征提取方法探讨_第1页
基于粗糙集的车牌字符特征提取方法探讨_第2页
基于粗糙集的车牌字符特征提取方法探讨_第3页
基于粗糙集的车牌字符特征提取方法探讨_第4页
基于粗糙集的车牌字符特征提取方法探讨_第5页
资源描述:

《基于粗糙集的车牌字符特征提取方法探讨》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于粗糙集的车牌字符特征提取方法探讨2008年第6期No,6,2008九江学院学报JournalofjiujiangUniversity(总第149期)(SmnNO149)基于粗糙集的车牌字符特征提取方法探讨舒彤舒田华余香梅(九江学院电子_Y■程学院江西九江332005)摘要:本文介绍了一种基于粗糙集理论的优化车牌字符识别的方法.粗糙集理论是种继神经元网络和模糊数学Z后的新的处理含糊和不确定性知识的数学工具;粗糙集方法是一种具有发展潜力的智能信息处理方法.木文主要思想就是在汉字的网格特征提取过程中保持分类能力不变的

2、前提下,通过知识约简提出了一种车牌字符网格特征选择的改进算法;它不仅找出了对识别最有效的网格特征集,而且可以大大降低图像特征空间的维数,减少工作量和无用特征干涉,从而提高了分类识别率.关键词:粗糙集;字符识别;分类;知识约简;特征中图分类号:TP391.4文献标识码:A文章编号:1673—4580(2008)06—0036一(o4)粗糙集(Roughsets)是由波兰数学家乙Pawlak于1982年提出的一种数据分析理论"-2J.1991年乙Pawlak的专着《粗糙集一一关于数据推理的理论》(RoughSets一T

3、heoreticalAspectsofReasoningaboutData)较好地总结了这一时期的RS理论与实践的研究成果,促进了它们的进-步发展.粗糙集理论是一种刻划不完整性和不确定性的数学工具,能有效地分析不确定,不一致,不完整等各种不完备信息.在国内外,粗糙集理论成为信息科学最为活跃的研究领域Z—,被广泛应用于人工智能,模式识别,语言识别,医辽数据分析,各种智能信息处理等领域,并取得了丰硕的成果J・粗糙集的一个重要特点是具有很强的定性分析能力,直接从给定问题的描述集合出发,而不需要预先给出某些特征或属性的数量

4、描述;从不可分辩关系和不可分辩类确定给定问题的近似域,从而找出该问题中的隐含知识,揭示内在规律.与其它的分类方法不同,粗糙集将知识与分类有机地联系在一起,建立了知识就是一种对对象进行分类的能力的概念•在汽车车牌字符识别屮,字符的点阵可以被认为是一个知识表达系统,我们所求的字符特征就是属性,运用粗糙集的有关知识可对知识进行约简.在汽车车牌字符识别中通常采用字符的粗网格特征,粗网格特征反映了字符的整体形状分布•但网格的划分具有一定的困难.若网格划分太细,则汉字的特征维数过多而产生很多的冗余,其至有吋会把有用的主要分类特

5、征淹没在大量无用特征之中,造成所谓”特征维数灾难”.若网格划分太粗,则字符特征维数较小,分类能力相应较弱.而且通过进一步分析不难发现,在字符特征网格中并不是所有网格对分类都是同等重要的•因此,合理选择网格字符的网格特征是OCR中一个至关重要的步骤[51.1基于模糊数学的汉字粗网格特征离散提取1」汉字粗网格特征通常粗网格特征提取方法是先把待识别字符进行大小和位置归一化,再等分为nXn个网格,然后依次统计各网格内的黑像素(或白像素)的数量,从而取得一个nXn维的网格特征向量.如图1所示.图la6X6的网格特征示意图在本

6、文屮将汉字图像的大小归一化为48X48点阵,再等分为6X6个网格,如图1口所示,每个网格中含有8X8个象素点阵•统计各网格中的象素数即可以得到36维的网格特征向量.粗网格特征是属于统计特征中的局部特征,又称局部灰度特征•通过统计每个网格屮的像素数量,使每个网格各自反映字符的某-部分特征,粗网格特征反映了字符的整体形状分布•在识别阶段,把各个网格组合起来作为字符的统计特征以此来识别字符.从上面的思路上中可以看出粗网格特征的优点是:容易提取,便于理解的统计特征,适用于字型变化较小或数量收稿日期:2008—05—16作者

7、简介:舒彤(1976一),男,九江学院电子工程系讲师,硕士,从事人工智能方向的研究.2008年第6期九江学院学报?37?有限的字符;其缺点是由于特征维数较多使抗干涉能力差,运算吋间花费多.832123448215244311503654362332322248248524614544014484086130274028图lb6X6的网格特征向量1.2基于模糊数学的特征离散化由于粗糙集只能处理定性的数据或概念类的对象,而从汉字点阵中提取的汉字特征数据过于分散,所以对从字符中提取的特征要进行必要的归一化,泛化.为了运算

8、方便,本文根据车牌的实际情况,运用模糊数学的方法将字符特征泛化为五个等级,即:少,较少,屮,较多,多五个语言变量;分别用123,4,5五个数值表示.为了运算方便,木文对车牌上有限的30多个汉字进行统计,建立如图2所示的将粗网格数量特征转换为语言变量的隶属度曲线.1020304050图2特征泛化隶属度曲线例如:车牌汉字”皖”的粗网格特征共有36维,为(8321

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。