基于matlab的语音信号的清浊音分析

基于matlab的语音信号的清浊音分析

ID:31332533

大小:239.36 KB

页数:17页

时间:2019-01-08

基于matlab的语音信号的清浊音分析_第1页
基于matlab的语音信号的清浊音分析_第2页
基于matlab的语音信号的清浊音分析_第3页
基于matlab的语音信号的清浊音分析_第4页
基于matlab的语音信号的清浊音分析_第5页
资源描述:

《基于matlab的语音信号的清浊音分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、目录1语音信号概述11.1语音信号的基本组成11.2语音信号的“短时谱”11.3基音周期21・4短时分析技术22语音信号的采集及清浊音分析22.1语音信号的釆集22.2采样分帧32.3短时能量和短时平均幅度42.4短时过零率62.5短时自相关函数83心得体会10主要参考资料10附录111语音信号概述1.1语音信号的基本组成语咅信号的基本组成单位是咅素。咅素可分成“浊咅”和“清咅”两大类。如果将不存在语音而只冇背景噪声的情况称为“无声”。那么音素可以分成“无声”、“浊音”、“清音”三类。一个音节由元音和辅音构成。元咅在咅节中占主要部分。所有元咅都是浊咅。在汉语普

2、通话中,每个咅节都是由“辅音一元音”构成的。在信号处理小,语音按其激励形式的不同可分为2类:(1)浊咅当气流通过声门时•,如果声带的张力刚好使声带发生张弛振荡式的振荡,产生一•股准周期的气流,这一气流激励声道就产生了浊音。这种语音信号是1种激励信号,它是由规则的全程激励产生的,其时域波形具有准周期性,语音频率集屮在比较低的频率范围内,短时能量较高,由于语音信号小的高频成分有高的过零率而低频有低的过零率,因此浊音的过零率低。通常,浊咅信号可以由周期激励通过线性滤波器合成。(2)清音当气流通过声门时,如果声带不振动,而在某处收缩,迫使气流高速通过这一收缩部分而产生

3、湍流,就得到清咅。清咅是由不规则的激励产生的,发清音时声带不振动,其时域波形不具有周期性,自相关函数没冇很强的H相关周期峰,其语音频率集小在较高的范围内,短时能量较低,因而过零率较高。通常,清咅信号可由白噪声通过线性滤波器合成。1.2语音信号的“短时谱”对于非平稳信号,它是非周期的,频谱随时间连续变化,因此由傅里叶变换得到的频谱无法获知其在齐个时刻的频谱特性。如果利用加窗的方法从语音流屮取出其屮一个短段,再进行傅里叶变换,就可以得到该语音的短时谱。1.3基音周期浊咅信号的周期称为基咅周期,它是声带振动频率的倒数,基咅周期的估计称为基音检测。基音检测是语音处理屮

4、的一项重要技术,它在冇调语音辨意、低速率语音编码、说话人识别等方面起着非常关键的作用。但在实现过程中,由于声门激励波形不是一个完全的周期脉冲串,再加上声道影响去除不易、基音周期定位困难、背景噪声影响强烈等一系列因素,基音检测而临着很大的困难。现在已有很多性能优越的基音检测算法,F1相关基因检测算法就是一种基于语咅时域分析理论较好的算法,在这里基于声音文件比较稳定的基础上,使用观察法获取基音周期。1.4短时分析技术语音信号具有时变特性,但在一个短时间范围内(一般认为在10〜30ms的短时间内),其特性基本保持不变,即相对稳定,因而可以将其看作是一个准稳态过程,即

5、语音信号具冇短时平稳特性。任何语音信号的分析和处理必须建立在“短时”的基础上。即进行“短时分析”,将语音信号分段来分析其特征参数,其中每一段称为一“帧”,帧长一般取为10〜30mso这样,对于整体的语音信号来讲,分析出的是由每一帧特征参数组成的特征参数时间序列。2语音信号的采集及清浊音分析2.1语音信号的采集该设计以本人的声音为分析样本。在MATLAB屮使用Wavread函数。可得出声音的采样频率为22050Hz,且声音是单通道的。利用sound函数,可清晰地听到读音为:“电子信息工程”的音频信号。采集数据并画出波形图如下所示,fs为采样频率,X为采样数据,接

6、下来对采样数据作傅里叶变换y二fft(x)并画出频谱图如图1所示:原始语音信号'波形图1原始语音信号波形及频谱图由频谱图可清楚地看到样本声音主要以低频为主。人的语音信号频率一般集中在200kHz到4.5kHzZ间,从声音频谱的包络来看,样本声咅的能量集中在0.lpi(l102.5IIz)以内,0.4pi以外的高频部分很少。所以信号宽度近似取为1.1kHz,由采样定理可得fs>2fo=2xl102.5=2205Hzo2.2采样分帧这里的采样是指从语咅信号中选取一段样本,一般取样点数为帧长的整数倍。每秒钟的采样样本数叫做采样频率,分帧主要完成将取样模块中获得的语音

7、样值点分为若干个语音帧,语音是不平稳的时变信号,在时间足够短的情况下,可以近似认为是平稳的,短时分析将语音流分为一段一段來处理,每一段就被称为一帧。分帧时需对语咅信号进行加窗操作,即用一个冇限长度的窗序列截取一段语音信号来进行分析,该窗函数可以按时间方向滑动,以便分析任一时刻附近的信号。常见的窗函数有:方窗、Hamming窗及Ilannig窗。如杲把窗函数理解成为某个滤波器的单位冲激响应,由于窗函数一般是屮间大两头小的光滑函数,因此该滤波器具有低通特性。窗口长度的选择非常重耍,窗长过短会使分析窗内没有包含足够的数据点来进行周期判断,且短时能量变化剧烈窗长过长,

8、短时能量是一段长时间的平均,不但不能反

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。