基于分形维数的语音端点检测算法研究

基于分形维数的语音端点检测算法研究

ID:34151393

大小:2.21 MB

页数:60页

时间:2019-03-03

基于分形维数的语音端点检测算法研究_第1页
基于分形维数的语音端点检测算法研究_第2页
基于分形维数的语音端点检测算法研究_第3页
基于分形维数的语音端点检测算法研究_第4页
基于分形维数的语音端点检测算法研究_第5页
资源描述:

《基于分形维数的语音端点检测算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、太原理工大学硕士研究生学位论文其谱的峰值点作为字词的分段点;同年,FrankK.Soong提出~种基于复倒谱系数的分段方法。1991年JanP.VanHemert提出一种基于LPC系数的分段方法,用两帧信号LPC系数的差异作为分段的依据;同年,A.Ljdje提出一种新的方法,首先用20ms窗取出一帧信号,计算几个复倒谱系数及其增量,能量及其增量,两帧信号间有10ms的重叠。1992年Tucker提出基于周期尺度的分段方法。1993年V.RalphAlgazi提出一种基于似然比例系数的分段方法。该方

2、法首先对每帧语音信号建立一个模型,然后计算相邻两模型的似然程度,以似然程度变化的峰值点作为分段点。1994年Erdal提出一种基于语音参数的分段方法。首先通过一定的方法判断此语音段是语音还是背景噪声。对于每个语音帧,将其分为4个5ms的子帧。对于每个5ms的子帧,计算其较为重要的8个参数:归一化的短时低通能量、归一化的短时高通能量、过零率、低频带的一阶、二阶反射系数、前向后向匹配相关系数及它们的乘积。这些参数描述了此语音信号的重要信息,继而用一定的算法进行推理,从而可以判定此信号是发声段还是非发声

3、段;同年HoytandWechsler提出基于能量水平、共振峰形状的端点检测算法。1995年EuvaldoF.CabralJr提出一种基于轨迹分段的音素分段方法。该算法首先将语音分成几个相等的时间段,每一段用一个N维的矢量表示。根据误差相等的原则,将原始信号归类成K个段。同年,张刚等提出一种基于自相关系数的分段方法。1996年Ta—Hsin.Li提出一种基于参数滤波的分段算法,该方法以参数滤波的手段测度语音信号相关结构的变化;同年Yoma等提出语音信号的自适应模型端点检测算法。1997年StanM

4、cClellan提出一种基于谱熵变化的分段方法,该方法的抗噪性能较好。1998年HongtaoHu应用小波变换的技术进行语音端点检测,在降低计算量的同时提高了算法的性能。同年Beritelli等提出了基于模式识别的语音信号端点检测算法。1999年sohn等人提出了基于统计模型似然比的端点检测算法,且该算法显示出良好的性能。他们采用在离散傅立叶变换(DFT)系数域的统计模型,无论是噪声环境下的语音和噪声谱分布均假设为联合高斯分布。2003年GazorandZhangandMartin提出了利用拉普拉

5、斯概率密度函数(PDF)为带噪语音和噪声谱建模,它被证明是一个更好的纯净语音分布的模型。2005年Shin等人提出的广义伽玛分布提供了一个比高斯、拉普拉斯和伽玛分布更好的纯净语音谱的模型。太原理工大学硕士研究生学位论文2000年W.Shin等提出了使用六种能量特征进行端点检测:全能量、听觉频率范围的能量:(300---3700Hz)、高频噪声(2---4l(Hz)、峰值、LPC误差能量和噪声滤波后的能量。其中,高频噪声有助于检测辅音,峰值有助于检测浊音部分,LPC残差能量对汽车类的低频噪声有一定抗

6、噪能力,并且使用对非语音部分建模的维纳滤波器滤掉噪声。2006年D.Ying等提出基于噪声特征空间投影的鲁棒性端点检测算法。在能量域语音与噪音通常有不同的分布,如果我们能分清含有低功率噪音和高功率语音的成分,我们则有可能提取更多可靠的语音信息即使带噪语音的平均信噪比很低。为此,首先,用主元分析(PCA)分析噪声观察值的估计协方差矩阵构造噪声特征空间。将带噪语音映射到噪声特征空间。在具有较小特征值得子特征空间中可以找到可靠的信息。与规模较小的特征值。因此,基于可靠信息就可以实现鲁棒性VAD。除了以上

7、几种方法之外,近些年以来,还有基于信息熵的语音信号端点检测方法llIJ;利用小波的带噪声语音信号端点检测方、法112J;应用倒谱系数作为判决特征的带噪语音端点检测方法【13】,它包括应用倒谱距离测量轨迹和应用循环神经网络的方法。经过研究发现,倒谱特征参数的语音信号端点检测方法在噪声环境下具有传统的能量方法无法比拟的优越性。基于NMM模型的检测方法也是语音信号端点检测中的重要方法【l41,用Viterbi解码算法对待测信号进行分解,求出语音的哪些语音帧与模型相匹配,从而得出端点所在处。实验表明这种方

8、法的准确率明显高于基于能量的方法。但是[-{MM的训练环境通常与实际被测信号的语音环境会有很大的差异,即背景噪声模型与实际情况不符合,此时性能会显著下降。因此,必须采用能自适应调节的背景噪声模型,具体实现方法还在研究中。另外,还有采用多层感知机MLP网络实现语音信号端点检测的方法【l51、采用自适应线性神经元网络(ADAL烈E)的端点检测方’法【16J。1.3主要研究工作及论文内容安排虽然,随着越来越多的研究者都来关注语音的端点检测技术,大量的语音端点检测算法相继被提出来,但是在现

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。