基于时频动态特征的单通道语音增强方法

基于时频动态特征的单通道语音增强方法

ID:35066063

大小:4.34 MB

页数:104页

时间:2019-03-17

基于时频动态特征的单通道语音增强方法_第页
预览图正在加载中,预计需要20秒,请耐心等待
资源描述:

《基于时频动态特征的单通道语音增强方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中文图书分类号:TN912.3密级:公开UDC:38学校代码:10005硕士学位论文MASTERALDISSERTATION论文题目:基于时频动态特征的单通道语音增强方法论文作者:郝悦学科:信息与通信工程指导教师:鲍长春教授论文提交日期:2016年4月UDC:38学校代码:10005中文图书分类号:TN912.3学号:S201302071密级:公开北京工业大学工学硕士学位论文题目:基于时频动态特征的单通道语音增强方法英文题目:SINGLE-CHANNELSPEECHENHANCEMENTMETHODBASEDONTEMP

2、ORAL-FREQUENCYDYNAMICS论文作者:郝悦学科:信息与通信工程研究方向:语音增强申请学位:工学硕士指导教师:鲍长春教授所在单位:电子信息与控制工程学院答辩日期:2016年6月授予学位单位:北京工业大学独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并

3、表示了谢意。签名:郝悦日期:2016.4.5关于论文使用授权的说明本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后应遵守此规定)签名:郝悦导师签名:鲍长春日期:2016.4.5本论文的研究工作得到了国家自然科学基金(61471014)的资助。摘要摘要在不考虑任何先验知识的情况下,传统的单通道语音增强算法(如维纳滤波法、谱减法、统计模型法)虽然在平稳噪声环境下能获得较

4、好的增强性能,但是在应对现实生活中常见的非平稳噪声时,增强语音中往往会伴随大量的波动噪声,会出现语音的高频成分丢失等问题。为此基于先验知识的语音增强方法应运而生,如码书驱动方法、隐马尔科夫模型方法和稀疏表示方法等。由于这些方法没有充分挖掘信号的时频动态特征和说话人特性,且需对噪声信号进行预分类训练,所以复杂度大而且实用性差,同时在短时间内很难准确地从非平稳的含噪语音信号中分离出纯净语音信号。为解决上述问题,本文提出两种基于长短时时频动态特征的噪声抑制方法和一种不需要噪声先验知识的基于短时时频动态特征的噪声抑制方法。(1)

5、本文提出了一种基于数据驱动模型的语音增强方法。所提方法通过最大程度地提取语音的长时时频动态特征——最大高斯时间序列(MaximumGaussianTemporalSequence,MGTS),并在基于修正最大后验概率(Maximumaposterior,MAP)准则的自适应搜索算法的基础上,结合矢量泰勒级数(VectorTaylorSeries,VTS)算法、连续谱合成算法和修正维纳滤波器,得到纯净语音的平滑估计结果。该方法有效恢复了被噪声淹没的语音高频成分,提高了增强语音的自然度和可懂度。(2)本文提出了一种基于语音信

6、号的短时时频动态特性的改进稀疏表示的语音增强方法。根据基于自适应阈值和几何终止准则的最小角回归(LeastAngleRegressionwithGeometricalStoppingCriterion,LARG)算法,确定含噪语音信号在组合字典的稀疏表示系数;并引入期望最大化(ExpectationMaximization,EM)算法和修正维纳滤波器,减小了数据驱动方法的复杂度,提高了增强语音的听觉质量。(3)本文提出了一种噪声估计与改进稀疏表示融合的语音增强方法,有效地解决了噪声预分类问题。本文利用分段信噪比,对数谱失

7、真,PESQ(PerceptualEvaluationofSpeechQuality)对各种增强算法进行了性能测试。测试结果表明,本文所提出算法的性能均优于参考算法。关键词:语音增强;时频动态特征;数据驱动模型;稀疏表示;维纳滤波;IAbstractAbstractConventionalsinglechannelspeechenhancementmethods,suchasWienerfilteringmethod,spectral-subtractionmethod,andshort-timespectralampl

8、itudeestimators,donotexplicitlymodelthecharacteristicsofspeechandnoiseasaprioriinformation,whichleadstogoodperformanceunderstationarynoiseenvironment,butpoorpe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。