自然场景下的文本定位

ID：33004322

大小：1.22 MB

页数：29页

时间：2019-02-19

资源描述：

《自然场景下的文本定位》由会员上传分享，免费在线阅读，更多相关内容在行业资料-天天文库。

1、自然场景下的文本定位第一章绪论第一章绪论1.1课题的背景和研究意义近年来，人类社会逐渐步入全新的信息化时代，数字图像处理技术也在随着日益发展，己经融入到科学研究的各个领域以及人们生活的各个领域，大到应用于全球范围内的环境气候监测的卫星遥感，小到安全领域广泛应用的指纹识别。目前，国内外有很多的研究者不断尝试各种方法以及改进一些方法，学术论文的发表数以千计，有的技术方法已经非常成熟，应用成果不断出现，例如：盲人导航系统、智能交通管理、文档处理和数字化图书馆、视频检索与分析系统、工业自动化系统等等，数字图像处理为社会带来了巨大的经济效益，同时也为人们的生活带来了很多便利。我们借助计算机进行图像处

2、理，主要目的是想通过计算机高效准确的处理出满足某种应用需求功能的图像。然而，数字图像处理作为信息处理中的关键技术之一还存在很多问题需要我们去研究和解决，其中准确彻底地定位出自然场景下的文本就是一个非常困难的问题，如：(1)图像中的背景(相别于文本部分)比较复杂，不仅包含文本，还包含自然景物如：建筑物、树叶等，含有比较丰富的纹理；(2)有的文本本身呈现一定的纹理，但是有的情况下文本是嵌入在纹理之中的；(3)自然场景的文本复杂多变，比如：受不同光照或者物体遮挡，文本的分辨率就不同，有的同一图像中文本的颜色、字符间距不同，有的文本为了追求艺术美是倾斜的，或者受外力影响是扭曲的等，而这些文本所呈现

3、的形式在定位和提取前都是先验未知的。到目前为止还没有一个统一的文本定位模型能处理各种形式的图像，各个研究者大都针对某一特定场景下的文本进行研究，这些复杂背景的因素以及图像处理方法的局限性都给自然场景文本定位带来了较大的困难，提高文本定位的准确率，具有非常重要的理论意义和实用价值。1万方数据自然场景下的文本定位第一章绪论1.2课题的研究现状近年来国内外开展了大量的研究工作，文本的检测、定位这方面的成果有很多。国外的主要是美国的科研机构，在这个方面取得了很大的成绩，另外，日本、韩国也有出色的工作。国内从事这方面研究的主要是中科院自动化研究，它们的工作主要集中于基于视频的文本定位，另外，清华大学

4、在静态图像的文本定位方面也有相当不错的成绩。微软亚洲研究院在文本定位与探测方面也有不错的工作[1][2][3]。总之，在复杂背景的图像中提取文本区域是计算机视频领域中非常难的一个课题，但这一研究具有众多的应用领域，从实用性的角度来说，目前，适用于各种不同情况下的文本检测和定位系统效果不是很好。目前，文本定位方法，一般可以分为四种：第一种是基于区域的方法，第二种是基于边缘的方法，第三种是基于纹理的方法，也有两种方法一起运用的，第四种是基于角点的方法。下面对文本定位在近年来的工作，从图像文本的一般特点上对文本的定位工作以及相关的研究方法作一个介绍。基于连通区域的文本定位方法Kim提出使用颜色聚

5、类分割图像的方法，没有把彩色图像转化为灰度图像，[4]直接把三维彩色图像分割之后进行投影分析处理得到备选文本区域，然后根据先验知识去除其中一些明显的非文本区域，最后根据先验知识规则合并文本区域。PalaihnaknoteShivakumara等人提出了应用于多方向文本的[5]Fourier-Laplacian方法，对输入图像首先进行傅立叶拉普拉斯滤波平滑噪声，然后运用形态学开运算和最大值不同取得文本簇和非文本簇，再细化文本簇，并把复杂的文本簇分割成多个简单的子文本簇，最后根据文本边缘密度和文本边缘线较直而非文本边缘线较弯曲规则来排除非文本区域，此方法能有效地提取图片文本和场景文本，无论是水

6、平文本还是非水平文本，都能较好的定位，但是理想的低通滤波的阈值不固定，不同的视频或者图片低通滤波阈值不同，该方法的可移植性不太好。CunzhaoShi等人使用MSER(MaximallyStableExternalRegions)建立图模型2万方数据自然场景下的文本定位第一章绪论[6]方法定位文本，首先对原图像进行MSER检测得到连通分量，然后构建图模型，其中，MSERs作为图的节点，并且对图定义一个成本函数，通过图割算法最小化成本函数。基于边缘的文本定位方法[7]M.Basavanna等人采用Sobel算子提取图像边缘，然后根据字符边缘间的距离大小固定的规则，使用边缘增长计算水平方向字符

7、边缘间距的大小，为了解决字符与字符之间边缘间距很小造成的字符粘连问题，采用零交叉点的方法。但是零交叉点方法要求文本分布必须是水平，否则就会有交叉，因此，当图像中含有倾斜文本或者水平和垂直文本都存在时，这种方法就不适用了。ZhaoXu等人针对视频中的文本采用Canny过滤器和边缘平滑处理方法检[8]测视频图像中水平和垂直方向的边缘，得到候选文本区域，然后使用灰度梯度、梯度特征、SVM分类器来验证真正的文本区域。MaLong

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 29



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

自然场景下的文本定位

自然场景下的文本定位

相关文章

相关标签