深度迁移度量学习

深度迁移度量学习

ID:39210119

大小:1.20 MB

页数:14页

时间:2019-06-27

深度迁移度量学习_第1页
深度迁移度量学习_第2页
深度迁移度量学习_第3页
深度迁移度量学习_第4页
深度迁移度量学习_第5页
资源描述:

《深度迁移度量学习》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、深度迁移度量学习摘要:传统的迁移学习方法通常假定训练样本和测试样本在类似的场景中被捕获,使得它们的分布被假定为相同。这个假设在许多真实的视觉识别应用中不成立,特别是当在不同的数据集中捕获样本时。在本文中,我们提出了一种新的深度迁移度量学习(DTML)方法,通过将标记源域中的辨别知识传输到未标记的目标域来学习一组用于跨域视觉识别的层级非线性变换.具体来说,我们的DTML通过最大化类间变化和最小化类内变化来学习深度量度网络,以及最小化网络的顶层处的源域和目标域之间的分布散度。为了更好地利用来自源域的判

2、别信息,我们进一步开发了深度监督的迁移度量学习(DSTML)方法,通过包括对DTML附加目标,其中DTML的隐藏层和顶层的输出被联合优化。在交叉数据集的人脸验证和人员重新识别的实验结果验证了提出的方法的有效性。1、引言如何设计良好的相似性函数在许多计算机视觉和模式识别任务中发挥重要作用。通常,给定视觉问题的最佳相似度函数是任务特定的,因为不同任务的基础数据分布通常是不同的。机器学习的最新进展表明,比hand-crafed距离度量,直接从一组训练示例样本学习距离度量通常可以实现提出的性能要求。近年来

3、,在文献中提出了各种度量学习算法,其中一些已成功应用于视觉分析应用,如面部识别,图像分类,人类活动识别,人物重新识别和视觉搜索。现有的度量学习方法可以主要分为两类:无监督和监督。对于第一类别,学习低维子空间或mainfold以保留样本的几何信息。对于第二类别,学习辨别距离度量以最大化来自不同类别的样本的可分离性。由于使用训练样本的标签信息,监督度量学习方法更适合于识别任务。尽管近年来已经提出了许多监督度量学习算法,但是这些方法仍然存在两个缺点:1)它们中的大多数通常是寻求单个线性距离来将样本变换为

4、线性特征空间,这使得样本的非线性关系不能被充分利用。即使核方法可以用于解决非线性问题,这些方法仍然存在可扩展性问题,因为它们不能获得显式非线性映射函数;2)大多数人假设训练样本和测试样本是在类似的情景中捕获的,因此假设它们的分布是相同的。这个假设在许多真实的视觉识别应用中不成立,特别是当在不同的数据集中捕获样本时。为此,在这项工作中,我们提出一种新的深度迁移度量学习(DTML)方法用于跨数据集(交叉数据集)的视觉识别。图1示出了所提出的方法的基本思想。图1提出的DTML方法的基本思想。对于来自源域

5、和目标域的训练集中的每个样本,我们将其迁移到开发的深层神经网络。我们对网络顶部的所有训练样本的输出执行两个约束:1)类间变化被最大化,并且类内变化被最小化2)在网络的顶层的源域和目标域之间的分布散度被最小化。我们的方法通过将区分性知识从标记的源域传输到未标记的目标域来学习一组分层的非线性变换,在该目标域下,类间变化被最大化并且类内变化被最小化,同时最小化网络的顶层处的源域和目标域之间的分布散度。为了更好地利用来自源域的判别信息,我们进一步开发了深度监督的迁移度量学习(DSTML)方法,通过在DTM

6、L中包括附加的目标,其中隐藏层和顶层的输出被联合优化。交叉数据集的人脸验证和人员重新识别的实验结果证明了所提出的方法的有效性。2、相关工作深度学习:近年来,由于其在各种任务中的卓越性能,深度学习在计算机视觉和机器学习中已经引起了很多关注。通常,深度学习旨在直接从原始数据学习层次特征表示。最近的进展表明,深度学习已经成功应用于许多视觉任务,如图像分类[10,20],对象检测[29],动作识别[21]和面部识别[17,30]。近年来已经提出了许多深度学习模型,代表性的方法包括深层卷积神经网络[20],

7、深层神经网络[4],深层自动编码器[21],深层信任网络和深层监测网络。然而,他们中的大多数目的是通过深度模型而不是相似性度量来学习特征表示。最近,深度学习也已被用于度量学习,并且已经提出了几种度量学习方法。例如,Caietal引入了一种使用堆叠独立子空间分析的非线性度量学习方法。Huetal提出了一种区分性深度学习方法,其采用传统的神经网络,通过在网络的顶层执行大余量标准。虽然这些方法已经实现了相当好的性能,但是他们假定训练和测试样本在相同的环境中捕获,这在许多实际应用中并不总是满足。在这项工作

8、中,我们通过学习深度量度网络并考虑源域和目标域之间的分布差异,提出了一种深度迁移度量学习方法。迁移学习:迁移学习旨在解决来自源域的训练数据的分布与目标域的分布不同时的问题。在过去几十年中,已经提出了各种迁移学习算法,并且它们可以主要分为两类:基于实例的[8]和基于特征的[2]。对于第一类,为了在目标域中更好地学习,学习不同的权重以对源域中的训练样本进行排序。对于第二类,通常学习公共特征空间,其可以将从源域学习的信息传送到目标域。近年来,已经提出了几种迁移学习技术,并且代表性的方法包

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。