基于RL特征的光学公式识别方法.pdf

基于RL特征的光学公式识别方法.pdf

ID:54018009

大小:303.53 KB

页数:5页

时间:2020-04-28

基于RL特征的光学公式识别方法.pdf_第1页
基于RL特征的光学公式识别方法.pdf_第2页
基于RL特征的光学公式识别方法.pdf_第3页
基于RL特征的光学公式识别方法.pdf_第4页
基于RL特征的光学公式识别方法.pdf_第5页
资源描述:

《基于RL特征的光学公式识别方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第33卷第1期光学技术Vol.33No.12007年1月OPTICALTEC~NIGUEJan.2007!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!文章编号:1002-1582(2007)01-0079-04基于RL特征的光学公式识别方法"田学东,田大增,哈明虎(河北大学物理科学与技术学院,河北保定071002)摘要:提出了一种光学公式识别与分析的新方法,在公式符号提取与识别中采用RL(Run-length)特征以提高识别率。采用二层连通区域搜索算法提取公式符号的图像,其中第

2、一层为基于RL特征的符号提取,得到复合符号的整体连通区域;第二层为传统搜索方法,进一步确定这些复合符号中包含的单一符号。设计了专门的公式符号识别器,对公式符号进行识别;根据符号间的语义信息和几何关系得到公式的逻辑结构;最终表达为公式结构树。在对印刷文献中所含公式的识别实验中取得了较好的效果,表明该方法具有良好的应用前景。关键词:OCR;光学公式识别;符号识别;结构分析;RL特征中图分类号:TP391.44文献标识码:AAnapproachforopticalformularecognitionbasedonRLfeaturesTlANxue-don9,Tl

3、ANda-zen9,HAmin9-hu(CollegeofPhysicsscienceandTechnology,~ebeiUniversity,Baoding071002,China)Abstract:Anewmethodforopticalformularecognitionandanalysiswasputforward.TheRLfeatureswereusedinfor-mulaextractionandrecognitiontoimprovetherecognitionaccuracy.Thesymbolimageswereobtainedwi

4、thatwo-layerssearchingalgorithmofconnectedcomponents.Inthefirstlayer,theconnectionareasofcomposedsymbolswereextractedwithRLfeatures.Andthesinglesymbolscontainedinthesecomposedsymbolswereidentifiedwithatraditionalwayinthesecondlayer.Aspecialrecognizerwasdesignedtoidentifythesesymbo

5、limages.Thelogicalstructurewasobtainedaccordingtotheirgeometricalfeaturesandlingualinformation.Theanalysisresultwaspresentedasaformulastructuretree.Theexperimentsweredoneonsomemathematicalexpressionswithinprinteddocument.Theresultsshowthatthemethodisofimmensepracti-calandtheoretic

6、alvalue.Keywords:OCR;opticalformularecognition;symbolrecognition;structuralanalysis;RLfeature领域,加速科技文献数字化,促进数字图书馆的建0引言设,具有重要意义。网络与多媒体技术的发展带来了对信息的巨大光学公式识别技术一般可以分为两个阶段,即需求。如何将纸介质信息高效输入计算机成为信息字符识别和结构分析。字符识别阶段的任务是对公处理技术的瓶颈问题。OCR(光学字符识别)技术可式图像进行切分,得到单个符号的图像,提取特征并以自动识别印刷(书写)在纸张(介质)上的文字图

7、识别;结构分析阶段利用符号识别的结果和已有的像,将其转换为相应文字的编码存入计算机,速度远公式结构和语言知识,得到公式符号之间的逻辑关远高于手工录入,成为信息数字化的有效途径,得到系,并以适当的方式表示出来。图1为光学公式识了很快的发展。目前,OCR技术日趋成熟,识别率别与分析的流程图。能够满足实用要求。但是,现有OCR系统普遍存在近年来,愈仅能“识字”的缺陷,对于在科技文献上频繁出现的来愈多的研究人数学公式束手无策,只能将公式作为图像存储。而员开始重视此项公式作为世界通用的科技交流语言,在科技文献中研究[1,2]。在字图1光学公式识别流程图的作用毋庸置疑

8、,因此,一个无法识别公式的OCR符识别环节中,产品在科技文献面前变

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。