ch2数字语音处理基础(OLD)

ch2数字语音处理基础(OLD)

ID:45033814

大小:4.12 MB

页数:65页

时间:2019-11-08

ch2数字语音处理基础(OLD)_第1页
ch2数字语音处理基础(OLD)_第2页
ch2数字语音处理基础(OLD)_第3页
ch2数字语音处理基础(OLD)_第4页
ch2数字语音处理基础(OLD)_第5页
资源描述:

《ch2数字语音处理基础(OLD)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、大连海事大学信息科学技术学院光电信息工程研究所主讲人:乌旭E-Mail:xuwu@dl.cnTel:86958567语音信号处理第二章数字语音处理基础2.1语音信号的基本特性2.2发音的生理器官与过程2.3听觉和感知2.4语音信号的特性分析方法简介2.5语音学基础及波形特征2.1语音信号的基本特性(1)语音信号(SpeechSignal):一般地,语音信号是指由人的发音器官所发出的声音信号;广义地说,我们所研究地语音信号可能包括人或其他动物所发出的声音信号以及环境噪声和其他机械装置(如乐器)所产生的声音

2、信号。其能量(信息)主要集中在0~4000Hz带宽范围内。音频信号(AudioSignal):人的听觉系统所能感知的声音信号,其频率范围在20~20,000Hz。电话语音信号由于语音信号的能量主要集中在0~4000Hz的频带内,因此传统的电话语音通信系统中采用300~3400Hz的带通滤波器来限制通过电话网络传输的语音信号。语音信号处理研究的对象主要还是由人的发音器官所产生的语言声音信号。语音信号的基本特征:频谱分量集中在300~3400Hz短时平稳性在5~50ms的短时内,信号的其本特征具有平稳性:能

3、量过零率频谱周期性语音信号的组成结构音素是语音信号的基本组成单位。音素(Phoneme)->音节(Syllable)->词(Word)->句子(Sentence)元音(Vowel)辅音(Consonant)音素音素浊音(Voice)清音(UnVoice)静音(Silence)2.1语音信号的基本特性(2)浊音声带振动有周期性频谱上表现出共振峰特性清音声带不振动频谱上有噪声特性静音环境噪声产生的信号,与人的发音系统无关2.1语音信号的基本特性(3)清音与浊音浊音(VoicedSpeech)声带的振动产生准

4、周期的声门脉冲激励声道产生浊音;在时域是准周期的(quasi-periodic),在频域具有谐波结构;周期脉冲的频率就是基频(FundamentalFrequency)或基音(Pitch);清音(UnvoicedSpeech)当气流在声道中受到阻碍时,产生湍流,此时生成清音。清音在时域类似随机噪声,在频域具有宽带特征;语音信号的时域波形时变特性:有时准周期性、有时随机噪声特性平稳性:在短时内保持相同特性幅度特性:幅度时大时小男人可以在社会上参加一切活动男。。。。。。。。。。。。人可。。。。。以。。。。。

5、。。。。。语音信号的短时谱(1)语音短时谱:从语音信号流中利用加窗的方法取出其中的一段,再对其进行傅立叶变换,可以得到该“短时语音”的短时频谱。浊音谱清音谱语音信号的短时谱(2)浊音谱:频谱曲线比较规则,频谱中具有几个明显的周期性起伏点。这些峰值点称为共振峰(Formant),其对应的频率成为共振峰频率,用F1、F2….表示,分别成为第一共振峰、第二共振峰、…。一般地,共振峰有5~7个,其中前三个携带大量地语音信息,对区分不同地语音非常重要。清音谱:谱结构较平坦,无明显的周期性起伏结构;没有明显的共振峰

6、特性;类似一般的随机噪声谱特性。2.2发音的生理器官与过程2.2发音的生理器官与过程发声器官主要由四个功能部分构成:肺和气管:动力部分喉:激励生成机构声道:受激励系统,它对声音进行调制,形成语音嘴:完成声道气流的辐射,形成声波2.2发音的生理器官与过程语音产生的机理图肺活量声带(声门)咽腔软腭鼻腔口腔气管及支气管鼻音口音主声道:声门以上,经咽喉、口腔的管道。鼻道:经小舌和鼻的管道称为鼻道。次声门系统:经肺、气管和支气管的管道。肌力喉的构造肺部气流通过喉部构成发音的动力--激励部分喉部发音器官的关键部位-

7、-声带声带之间的空隙--声门声带功能:吃东西时闭合,防止食物误入肺中;来自肺部的发音气流通过声门时,声带的开放与闭合,形成一个气流脉冲,构成发音的动力部分。发浊音时,气流冲击声带振动,产生周期性的气流脉冲发清音时,声带张开,气流顺利通过声门2.2发音的生理器官与过程——激励125Hz基因频率时,声带开启的面积和时间的关系声带每开启/闭合一次的时间(即声带的振动周期)就是语音的基因周期,其倒数称为基因频率,通常约为50~450Hz成年男性:50~250成年女性:200~4502.2发音的生理器官与过程通过

8、声门的周期性气流的周期Tp称为基音周期(PitchPeriod)Fp=1/Tp称为基音频率(FundamentalFrequency)不同年龄、不同性别的人发出的声音的基因频率有不同的特征:老年人的声带松弛,基因频率低小孩的声带短,基因频率高女人的基因频率普遍比男人高Fp男人50~250女人200~450基音频率是我们区分不同人的声音的主要特征之一2.2发音的生理器官与过程2.2发音的生理器官与过程声道纵剖面图——调制2.2发音的生理器官与

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。