基于改进算法的基音检测及其应用

基于改进算法的基音检测及其应用

ID:38113257

大小:726.61 KB

页数:6页

时间:2019-05-25

基于改进算法的基音检测及其应用_第1页
基于改进算法的基音检测及其应用_第2页
基于改进算法的基音检测及其应用_第3页
基于改进算法的基音检测及其应用_第4页
基于改进算法的基音检测及其应用_第5页
资源描述:

《基于改进算法的基音检测及其应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、26高职论丛2008年3月基于改进算法的基音检测及其应用张庆芳,刘正,黄英(苏州经贸职业技术学院江苏苏州215009)摘要:语音信号的基音周期在语音压缩编码、语音分析与合成、语音识别和说话者确认等方面是很重要的参数。到目前为止,还没有一种方法能在不同的话者、不同的环境下都达到最佳的效果。根据汉语语音信号的特点,本文首先对语音进行滤波处理、中心削波处理来滤除语音中高次谐波成分及高频噪声,接着利用修正自相关函数提取语音基音周期,最后对所得的结果进行平滑处理。实验结果显示改进算法提高了基音提取的可靠性,最后本文在改进算法的基础上进行了声调识别。关键词:语音;基音;自相

2、关;声调ApplicationofImprovedAlgorithmbasedonPitchDetectionAbstract:BSTRACTPitchperiodisacrucialspeechparameterinmanyapplicationssuchasspeechcompresscod2ing,analysisandsynthesis,speechsegmentationandautomaticisolatedwordrecognitionetc.Untilnow,thereisnomethodthatcandetectthepitchperiodpe

3、rfectinanyconditions.InthelightofthepropertiesofChinesespeech,thispaperpresentsamethodwithshort-timeauto-correlationtodetectthepitch,thenthepapergetsthetonebasedonthepitch.Keywords:Speech;Pitch;Auto-correlation;tone1引言汉语是一种“声调语言”。在用汉语相互交谈中,人们不但凭不同的声母、韵母(或元音,辅音)来辨别字和词的意义,还需要从不同的声调来区别它

4、们,这就是“声调语言”的特点。例如,星(xīng),行(xíng),醒(xǐng),姓(xìng)这四个字的音中,声母和韵母都是相同的,但意义不同,这正是声调不同所致。再如:树木,书目等的区别,也是靠声调来实现的。因此汉语的声调具有辨义的功能,它和辅音、元音在语音的区别特征上同样重要。目前声调识别有很多方法,但一般都基于基音的轮廓信息。基音是指声带震动的基频,它是随着时间和发音高低而不断变化的。基音变化的不同轨迹也就是我们所说的声调。因此声调识别是以提取基音为基础的。本文首先利用一种改进的自相关算法来提取基音,然后在此基础上进行声调的识别。2基音周期检测211短

5、时自相关函数一个时间离散确定信号的自相关函数定义为:∞«(k)=6x(m)x(m+k)(1)-∞如果信号是随机的或周期性的,这时的定义是∞1«(k)=lim6x(m)x(m+k)(2)N→∞2N+1-∞在任一种情况下,信号的自关函数表示法都是描述信号一定特征的一种方便的方法。例如,如果信第1期总第11期张庆芳,刘正,黄英:基于改进算法的基音检测及其应用27号是以P个抽样为周期的,那么很容易给出«(k)=«(k+P)(3)也就是说,周期信号的自相关函数也以同样的周期为周期。自相关函数的其它重要特性为:1)它是一个偶函数,即«(k)=«(-k)。2)在k=0达到它的

6、最大值,即所有的k来说

7、«(k)

8、≤«(0)。3)对确定信号,数量«(0)等于能量(式(1)),对随机或周期信号,它等于平均功率。因此,自相关函数相当于一个特殊情况的能量。而更为重要的是它是表示周期性的一个方便方法。如果我们将特性1和特性2结合起来一起来考虑式(3),我们将会看到,样0,±P,±2P,⋯⋯周期信号的自相关函数达到最大值。也就是,可以不用考虑信号的起始时间,而借确定自相关函数中的第一个最大值的位置来估计其周期。212修正的短时自相关函数周期性的峰峰值幅度随滞后时间k的增加而逐渐下降。这是因为用式(2)计算短时自相关时,随着k的增加,滞后积的数目(它

9、等于N-k)将减少,而短时自相关等于滞后积之和。不同长度的帧的短时自相关图:随着窗口(N)的减小,将不能检测出周期。(如图1所示)图1取不同帧长所得到的短时自相关图另外,在语音信号处理中,计算自相关函数所用的窗口长度与平均能量等情况略有不同。这里N至少要大于基音周期的二倍,否则将找不到第二个最大值点(除R(0)以外的最近的一个最大值点)。另一方面,N值也要尽可能地小;因为语音信号的特性是变化的,如N过大将影响短时性。理论上,语音的频率的范围大约在70-500Hz,即2-14129ms。而在检测语音基音周期时,一帧语音中应包含有2个以上的周期才可检测出基音周期。即

10、采样频率为111025K

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。