语音增强算法评估的研究

语音增强算法评估的研究

ID:38922633

大小:136.66 KB

页数:3页

时间:2019-06-21

语音增强算法评估的研究_第1页
语音增强算法评估的研究_第2页
语音增强算法评估的研究_第3页
资源描述:

《语音增强算法评估的研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第32卷第24期计算机工程2006年12月Vol.32No.24ComputerEngineeringDecember2006·多媒体技术及应用·文章编号:1000—3428(2006)24—0223—03文献标识码:A中图分类号:TP39语音增强算法评估的研究孟静,许刚(华北电力大学信息工程系,北京102206)摘要:研究了语音增强算法性能的评估方法。利用客观音质评价方便快捷的优点,针对SNR评估不能充分反映语音信号时变特征的不足,提出了采用IS、LLR、SegSNR3种客观失真测度与SNR相结合的评估方法。实验表明,该

2、方法可以有效地对语音增强算法进行整体和局部性能的评估。关键词:语音增强;算法评估;客观测度ResearchonEvaluationofSpeechEnhancementAlgorithmsMENGJing,XUGang(Dep.ofInformationEngineering,NorthChinaElectricPowerUniversity,Beijing102206)【Abstract】Thispaperexplorestheevaluationofspeechenhancementalgorithmperforman

3、ce.Theapproachitusesistocomputethedistancemeasureoftheoriginalanddegradedspeechsignalandthenaccomplishestheevaluationofspeechqualityaccordingtothedistancemeasure.Itselectsseveralspeechenhancementalgorithmsandcomparestheirperformancesthroughcomparingthedistancemeas

4、ure.Intheend,itconcludesaneffectiveevaluationforspeechenhancement.【Keywords】Speechenhancement;Algorithmevaluation;Distancemeasurement1概述由于噪声对同一段语音的影响是不均一的(如图1),因此由于语音质量主观评价费时费力,人们对客观音质评价同一种语音增强算法对于同一段语音的不同部分,例如元音、的研究不断深入。但是,目前的客观音质评价大都是为评价爆破音、摩擦音有着不同的增强效果,使用SNR这种简

5、单的语音编码和语音通信质量进行的[1,2],对于其在语音增强评估评估标准就有可能得不到准确的结果。本文采用客观测度与方面的研究尚没有系统的介绍。语音增强是语音处理的一个SNR相结合的方法,进行对语音增强算法性能的评估。重要领域,寻求一种有效的方法来对语音增强算法的性能进2语音质量评估的几种客观失真测度行评估,即对增强后的语音质量进行评价的研究意义很大。客观测度是指原始语音和失真语音之间的距离,是一种一个语音增强系统的有效性,通常采用SNR(Signalto误差度量。目前流行的几种客观失真测度有:Itakura-Saito(

6、IS)[3]Noise,信噪比)的提高作为评估标准。SNR的定义如下:失真测度,Log-LikelihoodRate(LLR)失真测度和分段信噪⎧⎫M比(SegSNR)失真测度等。2⎪⎪∑sn()2.1Itakura-Saito(IS)失真测度⎪⎪n=0用全极点模型表示的线性预测方法,广泛应用于语音信SNR=10log10⎨⎬(1)M号处理中。它在分析时得到的是模型预测系数⎪⎪(()ˆ())2∑sn−sn⎪⎪⎩⎭{a}(a1=,1≤≤kp,其中p为全极点模型的阶数)。为了n=0k0其中s(n)为原始语音信号,sˆ(n)为带

7、噪语音信号。SNR是比较用这种参数表征的矢量,如果直接用欧式距离,其意义在整个语音范围上的测量尺度,是对语音信号的长期测度,不大。因为仅由预测系数的差值不能完全表征两个语音信息不能充分反映信号的时变特征。的差别。IS是直接用由这些系数所描述的信号模型的功率谱d来比较的失真测度。通过计算纯净语音每帧的LP系数矢量aφd0.5原始语音和经过处理后的语音每帧的LP系数矢量a来获得。计算公d0-0.5式如下:00.511.522.533.542Tdd2σaRaσφφddd0.50dB带噪语音d[dd=][]+log()−1(2)I

8、S(ad,aφ)2Tdd20σσaRa-0.5dφφφφ00.511.522.533.542σ2其中,σd和φ分别代表处理后的和纯净语音帧的预测误差10分段信噪比基金项目:北京市科委重点基金资助项目(H030130270310)0作者简介:孟静(1981-),女,硕士,主研方向:语音信号处理与-1001

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。