资源描述:
《自然场景下的文本定位与提取》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、上海交通大学硕士学位论文自然场景下的文本定位与提取摘要自然场景下的文本定位与提取是当前热门且有实际应用意义的课题。随着高性能、低价格的便携数码产品的普及,场景文本的提取和识别正在快速发展。本文在对现有方法进行分析研究以后,结合自然场景中文本的特征,提出了新的解决方案。本文采用改进的Niblack阈值分割法和8邻接的连通域标记法提取场景图像中的连通分量,然后通过先验知识对连通分量进行限制,剔除比较明显的非文本连通分量,再通过机器学习方法之一——支持向量机(SupportVectorMachine,SVM)法对中间结果进行验证,剔除先验知识没有排除掉的非文本连通分量,最终得到文本
2、连通分量。实验结果表明本文所用的方法准确有效。为了更有利于识别,本文还对文本块进行二值化和倾斜校正处理。本文将基于Fisher准则的二值化方法应用在文本块的二值化上,利用Fisher准则函数自动选择最佳色彩特征,然后用Otsu法进行分割,分割效果良好,非常适合背景不太复杂的彩色文本块的分割。在对倾斜的文本行进行倾斜校正时,本文提出了一种用一组等距平行线探测倾斜角的方法,再根据倾斜角进行校正。关键词:文本定位,文本提取,支持向量机,阈值分割,倾斜校正,字符识别I上海交通大学硕士学位论文TextLocationandExtractioninNaturalSceneImagesAB
3、STRACTNowadays,textlocationandextractioninnaturalsceneimagesispopularandveryusefulinmanyapplications.Withtheincreasingavailabilityofportabledigitalimagingdeviceswithhighperformanceandlowprice,theresearchoftextlocationandextractionisdevelopingquickly.Aftermanyresearchesonthepublishedpapers,e
4、xperiments,andconsideringthecharacteristicsofthetextinnaturalscenes,thethesispresentsanovelmethod.First,connected-componentsareextractedusingimprovedNiblackthresholdingsegmentationand8-neighborhoodconnected-componentlabeling.Second,priorknowledgeisusedtodiscardsomeobviousnon-textconnected-c
5、omponents.ThenSVM,oneofthemachinelearningmethods,isusedtodiscardthenon-textconnected-componentsfurtherandgetthetextconnected-componentsfinally.Experimentsprovethatthemethodproposedinthisthesisisaccurateandefficiency.Formoreefficiencyrecognition,weproposethatbinarizationandtiltcorrectionshou
6、ldbecompletedinthetextregions.TheOtsusegmentationbasedonFishercriteriaisappliedtobinarization.FishercriteriacanchoosethebestcolorfeatureautomaticallyandthenOtsumethodisusedtobinarizeusingthatcolorfeature.Astothetiltcorrection,amethodusingagroupofparallellinestogetthetiltangleisused,andthenw
7、ecancorrecttheleantextlinesbasedonthetiltangle.Keywords:Textlocation,textextraction,SVM,thresholdingsegmentation,tiltcorrection,characterrecognitionII上海交通大学硕士学位论文上海交通大学硕士学位论文上海交通大学硕士学位论文第一章绪论1.1自然场景文本提取的意义及应用1.1.1自然场景文本提取的意义[1]自然场景下的文本检测和分割有着广泛的应用。随着高性能、