salient coding for image classification 用于图像分类的显著性编码

salient coding for image classification 用于图像分类的显著性编码

ID:14254714

大小:787.63 KB

页数:12页

时间:2018-07-27

salient coding for image classification 用于图像分类的显著性编码_第1页
salient coding for image classification 用于图像分类的显著性编码_第2页
salient coding for image classification 用于图像分类的显著性编码_第3页
salient coding for image classification 用于图像分类的显著性编码_第4页
salient coding for image classification 用于图像分类的显著性编码_第5页
资源描述:

《salient coding for image classification 用于图像分类的显著性编码》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、武汉科技大学本科毕业设计外文翻译SalientCodingforImageClassificationYongzhenHuang,KaiqiHuang,YinanYuandTieniuTanProceedingsof2011IEEEConferenceonComputerVisionandPatternRecognition(CVPR2011),ColoradoSprings,CO,USA,20-25June,2011.1753–1760.用于图像分类的显著性编码黄永贞,黄凯琪,禹沂南和谭铁牛2011年IE

2、EE计算机视觉与模式识别国际会议论文集.美国哥伦比亚科罗多州,2011年6月20-25日.第1753-1760页11武汉科技大学本科毕业设计外文翻译用于图像分类的显著性编码摘要基于码本的(词袋)模型是一种被广泛应用的图像分类模型。在这个模型中我们最近分析的编码策略,发现显著性是编码的基本特征。这个特点在编码中意味着如果一个视觉代码比其他代码更接近于描述符,它会得到一个很强烈的响应。最大池操作下的显著性表现导致许多数据库的先进性能的竞争。然而,大多数现有的编码方案不承认这种显著性表现形式,所以他们可能在代表局

3、部描述符中会导致大的偏差。在本文中,我们提出了“显著性编码”,其中采用与描述符最接近的代码和其他代码来描述描述符之间的比率。这种方法可以保证显著性表现没有偏差。我们研究显著性编码的两套图像分类数据库(15场景和帕斯卡的VOC2007)。实验结果证明,在图像分类上我们的方法优于所有其他的编码方法。1.导言图像分类是计算机视觉和模式识别领域的一个重要问题。它在许多应用中起着关键作用,如:视频监控、图像检索和网络内容分析。用于图像分类这里有许多方法,在基于码本的(词袋)模型[14]和它的扩展在许多著名的数据库(如

4、Caltech101[1]andCaltech256[2])和比赛(如PASCALVOC[3]andTRECVID[4])中实现了它先进的性能。图1(a)显示的是原始码本模型框架。首先,它通过检测器或密集采样的图像的局部特征提取,然后计算其描述符。对于局部特征检测,经典的检测器包括哈里斯探测器[17]和其扩展[25],最高限度稳定极值区域检测器[21]、仿射不变突出区域检测器[22]。对于局部特征的描述,我们通常使用局部描述符如Haar描述符[27],尺度不变特征变换(SIFT)描述符[20],梯度位置和方

5、向(GLOH)直方图描述符[23],旋转不变特征变换(RIFT)描述符[18],形状上下文[10],直方图梯度(HOG)描述符[15]。在获取局部特征(即描述符)后,该模型使用码本来代表他们。码本通常是被所有描述符聚类获得的一组码元,这个过程通常被称为“编码”。我们将在第2.1章详细介绍不同的编码策略。然后,对每个代码响应都将集成到一个空间池操作,例如,最大值或平均值的池。因此,一个图像的直方图描述的长度等于码本的大小。最后,直方图被发送到一个分类器,例如,Boosting[24],[16]或支持向量机(S

6、VM)[11],[13]的分类。11武汉科技大学本科毕业设计外文翻译图1(a)基于码本的框架模型。(b)演示了三种经典的编码策略。红色的球是一种局部描述符,绿色矩形是码元。在本文中,我们着重表示的是使用码本的描述符的进程。图1(b)说明了三种经典的编码策略。硬投票[14]采用的是原始码本模型。它反映的是发生频率的编码。在硬投票中每个描述符是由其最近的代码表示,这种方法简单和快速,但是在表现描述符时受限制。为了改善它,开发了软投票[26],其中一个描述符由多个编码表示。此外,频率由描述符和代码之间的欧氏距离取

7、代。该方案丰富了描述符的信息和提高了最终的分类精度。基于重建的方法,例如,稀疏编码[29]是另一个提高硬投票的方法。它选择一组代码,以重建1描述符增加约束代码数量。在进一步的研究中(例如,LCC[30]和LLC[28])这个位置约束编码的空间位置是集成的。重建的基础编码以及稀疏和局部性的限制,与硬投票和软投票[12],[30],[28]相比实现了非常良好的性能。我们以LLC为例做进一步分析。LLC采用与K最近的代码来编码一个描述符。如果有一个代码比其他代码更接近描述符,此代码中的响应会比其他代码更强大。我们

8、分别称这个代码和过程为一个显著性代码和显著性表现形式。显著性表现形式是鲁棒,因为显著性代码可以独立地描述该描述符。由于LLC使用最大池操作,只是最强烈的反应对每个代码也会保留,虽然它们用于重建,薄弱的反应也会被丢弃。这些弱的反应不稳定,因为他们需要结合其他的反应来表示一个描述符。因此,LLC再加上最大的池操作是不能获得精确的描述的,但是显著性可以表示描述符。然而,通过在LLC的最小二乘优化不能保证在所有情况下突出

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。