基于生成对抗网络的端到端多语音分离技术研究

基于生成对抗网络的端到端多语音分离技术研究

ID:37071828

大小:3.55 MB

页数:84页

时间:2019-05-17

基于生成对抗网络的端到端多语音分离技术研究_第1页
基于生成对抗网络的端到端多语音分离技术研究_第2页
基于生成对抗网络的端到端多语音分离技术研究_第3页
基于生成对抗网络的端到端多语音分离技术研究_第4页
基于生成对抗网络的端到端多语音分离技术研究_第5页
资源描述:

《基于生成对抗网络的端到端多语音分离技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:密级:UDC::编号专业硕士学位论文(工程硕士)基于生成对抗网络的端到端多语音分离技术研究硕士研究生:徐丹丹指导教师:王科俊教授企业导师:汤雁鸿教授工程领域:控制工程论文主审人:冯伟兴教授哈尔滨工程大学2018年6月分类号:密级:UDC:编号:专业硕士学位论文(工程硕士)基于生成对抗网络的端到端多语音分离技术研究硕士研究生:徐丹丹指导教师:王科俊教授学位级别:工程硕士工程领域:控制工程所在单位:自动化学院论文提交日期:2018年5月论文答辩日期:2018年6月学位授予单位:哈

2、尔滨工程大学ClassifiedIndex:U.D.C:ADissertationfortheProfessionalDegreeofMaster(MasterofEngineering)ResearchonEnd-to-EndMulti-SpeechSeparationTechnologyBasedonGenerativeAdversarialNetsCandidate:XuDandanSupervisor:Prof.WangKejunAcademicDegreeAppliedfor:MasterofEngineeringEnginee

3、ringField:ControlEngineeringDateofSubmission:May.,2018DateofOralExamination:Jun.,2018University:HarbinEngineeringUniversity摘要随着人工智能时代的到来,越来越多的智能设备走进人们生活,语音作为人机交互的重要接口,为生活带来了巨大便利,因此众多学者将语音处理的相关技术引入各个领域。但是目前的语音识别等技术都是建立在实验环境下,而在嘈杂的实际应用场景往往得不到好的效果。因此能够去除背景噪声或其他无关人说话干扰的语音分离技术

4、有很大的应用空间。生成对抗网络作为一个新兴的深度学习网络,在原有的单一深度学习模型的基础上,增加了判别模型,提高模型的学习能力。目前在图像生成领域,生成对抗网络有着非常突出的成绩,但是在语音分离问题上尚未有所开发,本文首次将生成对抗网络应用于语音分离问题。同时目前语音分离技术一般都是基于预先提取的音频特征作为网络输入,忽略了在提取特征的过程中造成语音高频部分以及相关性信息的损失,以及在变换过程中可能会引入虚假信息从而对语音分离的性能造成影响。所以本文采用生成对抗网络,以原始语音信号的波形作为输入,实现端到端的语音分离模型,并在原有网络的基

5、础上从以下几个方面对网络性能进行提升。1、针对传统声学特征提取方法需要经过傅里叶变换、离散余弦变换等操作,提取复杂特征作为输入的过程中会造成能量损失的问题,本文选择以语音信号的原始波形作为生成对抗网络的输入,通过模型来学习语音信号深层次的声学特征。2、提出基于生成对抗网络的端到端多语音分离框架。以在图像生成领域取得新突破的生成对抗网络为原型,采用深度卷积生成对抗网络DCGAN来提高网络稳定性,全卷积的网络结构提高了音频特征在时间上的紧密相关性,减少训练参数并缩短了训练时间。同时根据语音分离问题的特点加以改进,弥补了原有网络的不足进一步提升

6、分离效果并根据实验结果进行分析。3、为解决多语音分离问题,本文采用掩码循环的方式建立隐层变量与多分离目标之间的互信息。同时根据生成对抗网络生成模型与判别模型之间相互博弈的关系,将判别模型中判为真的数据反向传播作为生成模型的标签,实现数据扩张。一方面充分利用数据,完善训练效果,另一方面也解决了生成对抗网路中存在的不平衡问题。本文研究发现,生成对抗网络在经典语音分离模型中增加了判别模型,能够有效地提高分离的性能。应用于图像生成领域的生成对抗网络在语音分离领域同样取得了很好的效果。生成对抗网络在语音分离问题上的成功应用,也为语音信号处理领域提供

7、了新思路。关键词:生成对抗网络;语音原始波形;端到端模型;多语音分离;卷积神经网络ABSTRACTWiththeadventoftheageofartificialintelligence,moreandmoresmartdevicesareenteringpeople'slives.Voice,asanimportantinterfaceforhuman-computerinteraction,bringsgreatconveniencetolife.Therefore,manyscholarshaveintroducedrelated

8、technologiesforspeechprocessingintovariousfields.However,currenttechnologiessuchasspeechrecognit

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。