文献综述-李娜

文献综述-李娜

ID:35506908

大小:56.91 KB

页数:3页

时间:2019-03-25

文献综述-李娜_第1页
文献综述-李娜_第2页
文献综述-李娜_第3页
资源描述:

《文献综述-李娜》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、文献综述图像处理包含了一个人的许多有用信息,其作为一种简明美观的信息载体在现代商务活动中扮演着重要的角色。大量图像信息给人们带來方便的同时也带來了口常管理的麻烦,很多手机和PDA可用于名片管理,但能实现名片的自动化输入的并不多,或者效果还不英理想。本文以名片的识别和信息提取为课题,主要研究了图像的分割、识别和信息提取及理解的相关算法和实现。本文首先介绍名片识别系统的总体系统,包括图像的预处理、图像版而的分析、图像的字符分割、字符的识别、内容信息的理解。然后在对组成框架的各个模块和过程进行介绍和说明,并且对涉及到的相关算法进行阐述和比较,其屮重点介绍图

2、像屮文字区块的分制和名片内容的理解。1,研究背景近年來,随着信息技术的进步,尤其是人工智能的£速发展,在字符识别领域已取得了对观的成就,进入实用化阶段。OCR是OpticalCharacterRecognition的简称,指光学字符识别技术,是机器视觉技术研究和应用中的一个重要领域。光学字符识别技术的工作原理是通过扫描仪、数码相机或手机等光学输入设备获取纸张上的文字图片信息,采用光学的方式将文档资料转换成原始黑口点阵的图像文件,利用各种模式识别算法分析文字形态特征,判断和识别出字符文字,通过识别软件将图像中的文字转换成文木格式,并按通用格式存储在文本

3、文件或者数据库当中,还可以利用文字处理或者编辑软件等进一步加工。OCR技术是一种图像信息数字化的过程,这个过程帮助人们以低成木、快速度、高质量地将文档资料和各类纸介信息进行数字化,推进信息资源的开发和利用,进一步方便人们的生活、学习和工作。文本的名片图像的识别是OCR研究中的一个例子,OCR的研究成果使得名片识别系统的自动登陆成为可能。2,研究思路数字图像处理技术主要包括三个方面,一是前期的预处理,二是对处理后的结果进行识别,三是对识别后的结果进行信息提取。通常一个名片识别系统由以下几个部分组成;预处理只是为了去除噪声,加强有用的信息,并对输入测量仪

4、器或其他因索所引起的退化现象进行修复。通常,它包括对原始图像的去噪、倾斜校正,二值化等。预处理的方法也是因噪声的不同会稍有区别。比如字符分割和特征提取两部分都有较好的抗噪声能力,这一部分并不是必需的。版面分析主要是把文字和图像部分分开,它是对名片图像总体分析,识别出文本段落,图像,表格等。在名片识别系统屮,只是识别出文本区域,为接下來的文字识别作准备。字符分割是字符识别技术的一个难点也是关键技术之一。它是字符识别的前提,字符分割的好坏直接影响到字符的识别率。它是在行分割的询提下继续识别一个一个字,因为名片识别主要针对的是印刷体文字,所以这一块也是采用

5、通用的OCR印刷体字符识别方法。特征提取部分是名片识别系统的关键部分,特征图区的好坏,是决定字符识别率高低的最关键的要素。这是任何一个识别系统成功与否的关键,也是模式识别领域屮人们研究的热点。2,本文的优化处理传统的图像识别都是先对彩色图像进行灰度化、二值化、平滑、去噪声等一些预处理,然后再对得到的二值图像进行版面分析、分割和识别,1血对版面复杂的名片图像进行了版面分析和研究,却是针对扫描仪获取的名片图像。而在手机拍摄图像的过程屮,由于光照、背景和拍摄本身的原因,可能会使名片图像产生几何变形,名片的矩形边框在拍摄获得图像中不再是矩形,变成了不规则的四

6、边形,有的甚至产牛扭曲;另外,名片图形中的背景颜色不一,图形、文字、线条交错,使得直接对名片图像进行二值化处理的效果并不理想,甚至无法处理,既可能丢失一些冇用信息,也给后面的分割和识别工作带來了很多困难。分析样木图像可以看出,由于无法保证摄像头与名片平面相平行,使得名片图像发生了形变,其小名片的外围矩形边框发牛形变比较明显,变成了非常不规则的四边形,有的边框甚至不再是总线,但从局部看,名片图像中的字符块图像和图形(LOGO等)块等关键信息局部图像发生的形变却不是太明显,许多识别算法町以进行有效处理。本文主耍针对文字区块的分割问题介绍一种方法,直接在手

7、机摄像头获取的彩色名片图像的棊础匕利用四个方向的sobel算子进行边缘检测,得到四个方向的边缘图像,再在二值化的边缘图上求连通元索,然后根据连通元素的特征提找出文字区块的位置,最后在原彩色名片图像小提取出文字区块。山于利用的是彩色图像的边缘特征,因而可以在多背景的情况下,从名片图像中捉取出文字区块,包括了不同颜色、不同字体或者不同种语言的文字。该方法很好的保帘了文字的颜色信息,避免了信息的丢失。3,参考书目[1]丁晓青•汉字识别研究的回顾[J]•电子学报,2002,30(9).⑵章毓晋.图像处理和分析基础[M]・北京:高等教育出版社,2002.[3]

8、王普.图像处理中关于汉字粘连字符的分割和背景算法[J].2008(01).[4]KatherineDonal

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。