欢迎来到天天文库
浏览记录
ID:15304496
大小:5.47 MB
页数:3页
时间:2018-08-02
《利用模型选择确定视觉词袋模型中词汇数目》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、⦾图形、图像、模式识别⦾利用模型选择确定视觉词袋模型中词汇数目许明,韩军伟,郭雷,尹文杰XUMing,HANJunwei,GUOLei,YINWenjie西北工业大学自动化学院,西安710129SchoolofAutomation,NorthwesternPolytechnicalUniversity,Xi’an710129,ChinaXUMing,HANJunwei,GUOLei,etal.DeterminewordnumberofVisualBag-of-Wordsmodelbymodelselectionmethod.ComputerEngineering
2、andApplications,2011,47(31):148-150.Abstract:VisualBag-of-Wordsmodelhasbeenwidelyusedinimageclassification,retrievalandrecognition.However,itswordnumberusuallyisselectedbyuserexperienceordeterminedusingthesupervisedcross-validationscheme.Inthispaper,anunsupervisedmethodisproposedtoin
3、ferthewordnumberofVisualBag-of-Wordsmodel(BoW)basedontheideaofmodelselection.Firstly,GaussianMixtureModels(GMM)arebuiltaccountingforBoWswithdifferentwordnumber.After-wards,BayesianInformationCriterion(BIC)isadoptedtoselectthebestmodelthathastheminimumBICvalue.Comparedwithcross-valida
4、tionapproachusingimageclassification,theresultdemonstratestheeffectivenessoftheproposedapproach.Keywords:VisualBag-of-Words;modelselection;GaussianMixtureMode(lGMM);Bayesianinformationcriterion摘要:视觉词袋(VisualBag-of-Words)模型在图像分类、检索和识别等计算机视觉领域有了广泛的应用,但是视觉词袋模型中词汇数目往往是根据经验确定或者采用有监督的交叉学习选
5、取。提出一种确定视觉词袋模型中词汇数目的无监督方法,利用模型选择的思想来解决问题。使用高斯混合模型描述具有不同词汇数目的视觉词袋,计算各模型贝叶斯信息准则的值,选取贝叶斯信息准则最小值对应的词汇数目。与交叉验证的监督学习在图像分类实验的对比结果说明该方法准确有效。关键词:视觉词袋模型;模型选择;高斯混合模型;贝叶斯信息准则DOI:10.3778/j.issn.1002-8331.2011.31.042文章编号:1002-8331(2011)31-0148-03文献标识码:A中图分类号:TP371引言近年来,随着计算机网络的飞速发展和数字图像获取技术的进步,图像资
6、源正以惊人的速度增长,与图像视觉内容分析相关的应用越来越多。而所有这些应用的基础是图像视觉内容的有效表达。图像视觉内容的表达常常利用图像的底层特征,常见的有基于全局的颜色[1]、纹理[2]、形状[3]等特征,基于局部区域的SIFT[4]特征。视觉词袋模型[5]是目前最为流行的图像底层特征之一,它的基本原理:借鉴“字典”的思想,提取图像局部特征并进行量化处理,形成“字典”中的一组基本词汇,进而图像可以类似于文本的表示方法即统计基本词汇出现的频数。最近5年来,基于视觉词袋模型的图像表示方法被深入地研究并在图像分类、检索和识别等计算机视觉领域有了广泛的应用,其中Li等
7、[6]提出的基于贝叶斯方法的从少量样本中无监督学习目标类别,Fergus等[7]提出的从Google图像搜索引擎中学习目标类别,Philbin等[8]提出的基于大词汇和空间信息匹配的目标检索方法等。尽管视觉词袋的方法十分强大,如何自动确定词汇数目的问题仍然没有很好的解决。对于图像分类的应用,由于图像的类别信息已知,常常通过交叉验证的方法确定视觉词袋模型中词汇数目,实质上,该方法是一种有监督的实验手段,没有理论基础;而对于图像检索和识别往往无法获取图像的类别信息,有监督的交叉验证方法很难实现,因此词汇数目往往只能凭经验选取。词汇数目选择不合适,往往会给分类,检索和
8、识别的准确度带来较大的损
此文档下载收益归作者所有