基于弱监督深度学习的图像检索技术研究与实现

基于弱监督深度学习的图像检索技术研究与实现

ID:34681042

大小:1.80 MB

页数:67页

时间:2019-03-09

基于弱监督深度学习的图像检索技术研究与实现_第1页
基于弱监督深度学习的图像检索技术研究与实现_第2页
基于弱监督深度学习的图像检索技术研究与实现_第3页
基于弱监督深度学习的图像检索技术研究与实现_第4页
基于弱监督深度学习的图像检索技术研究与实现_第5页
资源描述:

《基于弱监督深度学习的图像检索技术研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP391学校代码:10697密级:公开学号:201531481基于弱监督深度学习的图像检索技术研究与实现学科名称:软件工程作者:王小鹏指导老师:管子玉教授西北大学学位评定委员会二〇一八年六月ResearchandRealizationonImageRetrievalBasedonWeakly-SupervisedDeepLearningAthesissubmittedtoNorthwestUniversityinpartialfulfillmentoftherequirementsforthedegreeofMasterinSoftwareengineeringByXiao

2、pengWangSupervisor:ZiyuGuanProfessorJune2018摘要深度学习技术发展已逾十载,其在诸多计算机视觉问题上都表现出了优秀的效果。图像检索作为该领域的重要问题,受到了研究人员和学者的广泛关注。当前图像检索问题中所使用到的深度模型多采用监督学习方法来训练模型,由于深度模型复杂度高、参数规模庞大,因而需要大量且质量较好的人工标注数据来训练模型。但是,上述有监督学习存在如下两个缺陷:1)由于人工标注需要耗费大量的人工和时间成本,因此对多数具体问题缺乏大规模标注数据。2)人工标注产生的强标签集存在无法描述细粒度的语义信息的先天劣势。针对上述两个问题,本文对互

3、联网上与图像检索相关的数据进行了深入调研。调研过程中发现随着移动互联和社交自媒体平台的普及,多数互联网用户会在网上分享他们的图像并添加自定义标签,从而形成了大量带标签的图像数据。这些用户产生的标注信息通常包含细粒度的图像视觉内容信息,可用于提取更具区分度的细粒度视觉语义。不同于监督学习中人工标注产生的强标签,这些由用户产生的社会化标签是一种弱标签,带有这种弱标签的数据称为弱标注数据。这种数据的标注过程不受约束,致使标签集存在噪声、模糊性语义及语义缺失等情况,从而无法直接使用监督学习方法来训练模型。因此,本文提出了一种基于弱监督深度学习的图像检索方法。该方法采用VGGNet(Visua

4、lGeometryGroupNet)做为基础模型并对其进行了改进。模型训练方面,本文采用大规模弱标注数据进行模型训练。同时,针对弱标注数据的缺陷,提出了一种抗噪声的弱监督学习策略来提取图像的高层次语义,使得具有相似语义的图像靠近,同时不相似语义图像互相远离。在此基础之上,再利用迁移学习方法进一步提弱监督模型的性能。本文所主要工作内容总结如下:1.过滤图像数据标签中非视觉性语义标签,并利用Skip-Gram模型训练过滤后的标签形成语义向量用于计算图像间的相似关系。2.预处理后的弱标注数据中仍受存在噪声、语义模糊、一词多义等缺陷,无法用于模型的训练。因此,本文提出一种相似度度量方法,利用

5、弱标签语义信息判断图片之间的语义相似度,削弱了噪声、一词多义、近义词以及语义模糊的影响。3.上述步骤处理后的弱标注数据仍存在噪声,因此本文提出了一种抗噪声的弱监督训练准则,可有效捕获图像弱标签之间的相似性视觉语义关系,使得具有相似视I觉语义的图像靠近,不相似语义的图像互相远离。4.在弱监督模型基础之上,利用迁移学习技术优化弱监督检索模型,提高模型性能。实验结果显示,本文提出的方法在查准率上优于目前主流的图像检索方法。本文创新点如下:1)面向弱标注数据,本文提出了一种抗噪声的弱监督训练准则,可训练获取到一个较好的高层视觉语义分布。2)在弱监督学习到的模型基础之上,本文提出了一种基于弱标

6、注数据的迁移学习方法来进一步提高模型性能。关键词:弱监督学习,图像检索,深度学习,迁移学习IIABSTRACTThedevelopmentofdeeplearningtechnologyhasbeenovertenyears,andithasshownexcellentresultsonmanycomputervisionissues.Asanimportantissueinthisfield,imageretrievalhasreceivedextensiveattentionfromresearchersandscholars.Thedepthmodelsusedincurren

7、timageretrievalproblemsmostlyadoptsupervisedlearningmethodstotrainthemodels.Duetothehighcomplexityofthedepthmodelandthelargescaleoftheparameters,alargeamountofmanualannotationdatawithgoodqualityisneededtotrainthemodel.However,thea

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。