基于笔画识别的视频图片文字提取方法.pdf

基于笔画识别的视频图片文字提取方法.pdf

ID:55809359

大小:818.08 KB

页数:5页

时间:2020-06-03

基于笔画识别的视频图片文字提取方法.pdf_第1页
基于笔画识别的视频图片文字提取方法.pdf_第2页
基于笔画识别的视频图片文字提取方法.pdf_第3页
基于笔画识别的视频图片文字提取方法.pdf_第4页
基于笔画识别的视频图片文字提取方法.pdf_第5页
资源描述:

《基于笔画识别的视频图片文字提取方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第47卷第3期天津大学学报(自然科学与工程技术版)V_01.47NO.32014年3月Journ~ofTianjinUniversity(ScienceandTechnology)Mat.2014D0I:10.11784/tdxbz201208001基于笔画识别的视频图片文字提取方法王萍,徐鹏,张艺凡(天津大学电气与自动化工程学院,天津300072)摘要:通过对笔画的对称边缘特点与文字几何特征的认识,根据二阶边缘检测算子捕捉边缘点亮暗变化趋势的能力,使用高斯型拉普拉斯算子寻找“边缘点对”,并构建来自笔画等窄带区域的“对称边缘

2、点对”样本集.从样本集的分布规律中自适应地定出文字笔画搜索窗的尺度及方向.利用最小生成树算法实现由系列搜索窗得到的所有笔画子区域的关联聚类,通过剪枝、伪区域鉴别和阂值分割,将文字以行(含非水平行)或列的形式提取出来.实验表明,该方法对复杂背景下不同的语言类型、亮暗类型、文字行方向及文字尺度具有适应性,在ICDAR数据集上的查准率和查全率分别达到76%和75%.关键词:基于内容图像检索;文字笔画提取;高斯型拉普拉斯变换;最小生成树中图分类号:TP391文献标志码:A文章编号:0493—2137(2014)03.0200—05T

3、extExtractionBasedonStrokeRecognitioninVideoWangPing,XuPeng,ZhangYifan(SchoolofElectricalEngineeringandAutomation,TianjinUniversity,Tianjin300072,China)Abstract.Accordingtogeometricfeaturesoftextsandthefactthatcharacterstrokeshavesymmetricaledges,LaplacianofaGaussi

4、an(LoG)wasemployedforfindingthe‘symmetricaledge—pointpair’.thenthe‘symmetricaledge—pointpairs’samplesetwasconstructed,thereforethescaleandorientationofthedetectwindowweredeter·minedbyanalyzingthesampledistribution.Therelationalclusterofallcharactersub—regionswasobt

5、ainedbyusingtheminimumspanningtree(MST)algorithm,thenthetextlines(includingnon-horizonta1)wereextractedintheformoflinesorrowsafterpruning,falsepositiveelimination,andthresholdsegmentation.Experimentsshowthattheproposedmethodiscapableofhandlingmultilingual,different

6、orientationandmulti—scaleimagesundercomplexbackgroundwitha76%precisionrateanda75%recallrateonICDARdataset.Keywords:content—basedimageretrieval;textextraction;LaplacianofaGaussian;minimalspanningtree近些年,Et益增长的多媒体视频引起了人们对于通过分析容易发现,文字笔画具有宽度的相对视频信息自动检索问题的关注⋯.视频图像文字提取平稳

7、性、其双边缘的平行性和多方向性,这3个I生质首先定位出文字区域的位置,再通过分割的方法提取几乎不随语种、文字的排列方向以及文字尺度发生变出文字进而进行文字识别【2J.就视频图像中文字区域化.笔者从这一特点出发,结合关联聚类和局部区域的定位问题而言,一般有基于边缘的方法、基于纹理的自适应分割技术实现视频图像中的文字提取.的方法和基于连通区域的方法_jJ.更一般地,视频图像中的文字在语种、字体、尺1文字笔画识别度、颜色、文字的间距、分布等方面差异较大,分辨率不一定很高,因而许多研究者为此做了大量工作【4],1.1笔画的双边缘特点

8、并在提高对多方向、多尺度及复杂场景的文字区域定在扫描图像时,一旦遇到亮背景下的暗文字笔位的适用性方面取得进展L5培】.画,均将历经一个由亮_+暗一亮的过程.如果将由亮收稿日期:2012.08—01;修回日期:2012.10—22.基金项目:国家自然科学基金资助项目(60865001).作者

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。