基于注意力机制的声音场景深度分类模型研究

基于注意力机制的声音场景深度分类模型研究

ID:34711321

大小:12.98 MB

页数:78页

时间:2019-03-09

基于注意力机制的声音场景深度分类模型研究_第1页
基于注意力机制的声音场景深度分类模型研究_第2页
基于注意力机制的声音场景深度分类模型研究_第3页
基于注意力机制的声音场景深度分类模型研究_第4页
基于注意力机制的声音场景深度分类模型研究_第5页
资源描述:

《基于注意力机制的声音场景深度分类模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据分类号:密级:TM863公开硕士学位论文⑧单位代码:10335学号:21521101英文论文题目:StudyofAttention-basedDeepmodelst('rACOUStlCSCeneUIaSSInCatlonn^』●■、,、.■●f’J●申请人姓名:夏子琪指导教师:王东辉副教授专业名称:计算机技术研究方向:人工智能所在学院:计算机科学与技术学院争挚Z?◆.\-可▲广加叭4⋯8㈨3叭6㈣4㈣3㈣Y万方数据基于注意力机制的声音场景深度分类一f嗍炒烨⑧论文作者签名:指导教师签名:论文评阅人1:

2、评阅人2:评阅人3:评阅人4:评阅人5:答辩委员会主席:委员1:委员2:委员3:委员4:委员5:答辩日期:兰望:三:2万方数据浙江大学研究生学位论文独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得浙江大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。学位论文作者签名:良3啵签字日期:b·s年≥月哆日学位论文

3、版权使用授权书本学位论文作者完全了解浙江大学有权保留并向国家有关部门或机构送交本论文的复印件和磁盘,允许论文被查阅和借阅。本人授权浙江大学可以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:恿寸妙\导师签名:签字日期:k.a年多月I≥日签字日期:二bf留年≥月l0日/万方数据浙江大学硕士学位论文摘要摘要通过分析声音使得设备能够理解设备所处环境是机器听觉研究领域的主要目标,机器听觉是一个涉及到计

4、算听觉场景分析的研究领域。机器听觉系统需要执行与人类听觉系统类似的处理任务,是诸如机器学习,机器人技术和人工智能等相关领域的更广泛的研究主题中的一部分。声音场景分类问题,是从属计算听觉场景分析的一个子问题,也是其中最困难的任务之一。人类可以感知到自身所在的声音场景,如繁忙的街道,办公室等,并能够识别其中的独立声音事件,如汽车经过,脚步声等。声音场景分类任务的目的之一就是要模拟人类分辨声音场景的能力:给定一段音频,对音频所记录描述的声音场景进行分类。可穿戴智能设备、智能家居日益融入到人们的日常生活中,通过声音感

5、知环境可以让这些设备更智能地服务于人,因此声音场景分类问题也受到越来越多的关注。对于声音场景分类问题的研究,本文设计了一系列深度学习模型包括卷积神经网络,递归神经网络,双线性模型以及胶囊网络模型,其中基于注意力机制的卷积神经网络模型,平均分类准确率达到87.9%,与声音场景分类研究领域的大规模挑战赛DCASE2016所有提交的结果相比,在单模型上优于最好成绩86.4%,是在声音场景分类问题中,注意力机制的首次尝试。为了进一步开发利用深度学习方法的优势,利用超大数据集预训练模型,运用迁移学习技术,弥补声音场景分

6、类领域训练样本不足的缺陷,在注意力机制模型的基础上设计了基于迁移学习的深度卷积神经网络模型,准确率达到90.3%,超过DCASE2016挑战赛第一名(89.7%)。关键词:声音场景分类;深度学习模型;注意力机制;迁移学习万方数据浙江大学硕士学位论文ABSTRACTAbstractHeIpingdeVicesunderstandtheenVironmentwherethedeVicesare10catedViatheanalysisofsoundisthemaintargetinthefieldofmachin

7、eauditoryresearch.Machineauditoryisa6eldofresearchthatinVolVescoInputationalauditoryscenea11alysis.1vIachineauditorysystemneedstoperformsimilarprocessingtasksasthehumanauditorysystemandispartofabroaderresearchtopjcinrelatedfieldssuchasmachinelearning,roboti

8、csandartificialintelligence.Theacousticsceneclassificationproblemisasub—problemofcomputationalauditorysceneanalysisandoneofthemostdi币culttasks.E’eoplecanunderstandwheretheyare,suchasbusystreets,o伍ces,e

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。