基于子空间语音增强方法的研究

基于子空间语音增强方法的研究

ID:9555254

大小:52.50 KB

页数:3页

时间:2018-05-02

基于子空间语音增强方法的研究_第1页
基于子空间语音增强方法的研究_第2页
基于子空间语音增强方法的研究_第3页
资源描述:

《基于子空间语音增强方法的研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、基于子空间语音增强方法的研究【摘要】目的:研究基于信号子空间的语音增强方法。方法:利用CoolEditPro2.0软件录制语音,加入各种噪声,利用Matlab软件进行分析、处理。结果:观察语音信号波形图和语谱图,利用信号子空间的分解方法,可使信噪比大大增加。结论:基于子空间的语音增强方法在主观听觉与客观指标上均得到了令人满意的效果。【关键词】子空间;语音增强;语谱图  AbstractObjective:Tostudyspeechenhancementmethodbasedonthesignalsub-spa

2、ce.Methods:Speechestoprovedalotbyreadingspeechandspeechspectrumandusingthesub-spacedeposition.Conclusion:Themethodofspeechenhancementbasedonsignalsub-spacehasachievedsatisfyingeffectsinbothsubjectivehearingandobjectivequota.Keyent;speechenhancement;speechsp

3、ectrum语音识别研究已经取得重大发展,但距离机器与人自由交流的目标还相当遥远。目前的识别系统大都是局限在安静环境中使用的,在噪声环境中,尤其是强噪声环境,语音识别系统的识别性能将受到严重影响。如何提高强噪声环境下语音识别的准确率是当前语音识别的难题之一。从带噪语音信号中提取尽可能纯净的原始语音的过程称为语音增强。污染语音的噪声包括窄带噪声和宽带噪声两类。对于低频干扰、串音等窄带噪声,一般用线性滤波器便可有效抑制,而宽带噪声无论从时域还是从频域看均与语音信号重叠在一起,传统的线性滤波无能为力。消除噪声的难点

4、在于宽带噪声的消除。  1材料和方法  1.1材料在实验室环境下利用CoolEditPro2.0软件录制一段语音,再利用matlab软件生成一段白噪声,合成不同信噪比(-10dB~10dB)的带噪语音。  1.2方法子空间语音增强算法主要是利用数据协方差矩阵的特征值分解,利用特征值的大小,将协方差矩阵的特征子空间分为信号子空间和噪声子空间两部分,并将含噪声语音投影到语音子空间中,以该投影作为语音信号的估计值。  1.2.1信号子空间语音增强的问题可以描述为从一被污染信号中,恢复出原始语音信号的过程。设语音帧长

5、为M,则每一帧信号都可看成是一个M维的矢量。M维的矢量信号可张成维数为M的空间CM。假设语音信号位于K维子空间中,并且K<M。原始纯净语音信号可以用以下的线性模型表示:s=VX=∑Ki=1xiviK≤M(1)V=[v1,v2,…,vK]是一个K×M的矩阵,它的秩是K,且各个矢量之间相互正交[1];X=[x1,x2,…,xK]T是一个M×1的矢量,是零均值的复随机变量。带噪语音信号可写成:y=V·X+n(2)y的协方差矩阵为:Ry=E(yyH)=Rs+Rn=VRxVH+Rn(3)其中Rs表示纯净语音信号s的协方

6、差矩阵,Rx表示向量X的协方差矩阵,Rn为噪声的协方差矩阵:Rn=σ2nI(4)  1.2.2K-L展开通过KL展开[2]将含噪语音信号所张成的空间分解成信号子空间和噪声子空间。先不考虑噪声的存在,只考虑纯净语音的情况下,对信号s的协方差矩阵Rs进行特征值分解,可以得到:Rs=Q∧QH=[Q1Q2]∧s10 00Q1HQ2H(5)  式中,∧s1=diag(λs1,…,λsk)是信号子空间的特征值,因为Rs是半正定阵,所以λsk≥0,1≤k≤K。因为语音信号在K维空间内,因此非零特征的个数为K。特征值向量矩阵

7、Q分解为2个子矩阵Q1和Q2。Q1矩阵包含非零特征值所对应的特征向量,定义这些特征向量为构成信号子空间的基本向量;Q2包含的特征向量张成空间定义为噪声子空间。  1.2.3H线性估计子线性估计子的滤波矩阵表示为H,则语音信号的向量可由下式估计:s=H·y(6)  则估计的语音值与真实的语音信号值的误差由下式给出:e=s-s=(H-I)·s+H·n=es+en(7)这里es=(H-I)·s表示语音信号的失真,en=H·n表示残余噪声。定义语音信号失真能量e2s=tr(E[eseHs])=tr((H-I)Rs(H

8、-I)H)和残留噪声能量e2n=tr(E[eneHn])=tr((H-I)Rn(H-I)H),Rs和Rn分别是纯净语音信号和噪声信号的协方差矩阵。频域约束估计子在把噪声约束在一门限值下的同时,尽量减少语音信号的失真[3]。纯净语音的最优估计矩阵可以通过求解下面的约束优化问题得到:Hopt=argminHe2s  约束条件:1Me2n≤σ2(8)增强系统的输出为:sopt=U1GμUH1y(9)其中G

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。