基于概率神经网络的汉语耳语音识别研究

基于概率神经网络的汉语耳语音识别研究

ID:33606341

大小:7.38 MB

页数:43页

时间:2019-02-27

基于概率神经网络的汉语耳语音识别研究_第1页
基于概率神经网络的汉语耳语音识别研究_第2页
基于概率神经网络的汉语耳语音识别研究_第3页
基于概率神经网络的汉语耳语音识别研究_第4页
基于概率神经网络的汉语耳语音识别研究_第5页
资源描述:

《基于概率神经网络的汉语耳语音识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于概率神经网络的汉语耳语音识别的研究第二章耳语音的相关知识第二章耳语音的相关知识2.1耳语音的相关知识汉语是单音节语言,绝大多数单字由声母和韵母组成。耳语音与正常语音有着不同的发音方式。汉语正常语音的声母部分发音时,声道某处有一定的阻碍;韵母部分发音时声道没有阻碍,声带相对靠拢,形成窄缝声门,气流从窄缝中挤出时引起声带振动(振动的频率称为基音频率,基音频率的倒数则称为基音周期),形成准周期性的脉冲串声源,通过声道谐振形成共振峰。而耳语音是一种单一发音类型,声门前部(韧带)完全靠拢,后部(杓状软骨)由一个宽三角

2、裂隙。气流通过开放区产生摩擦噪声,形成耳语音。耳语音的清擦音、塞擦音和塞音声母部分与正常音的发音方式没有大的区别,而韵母部分发音时声门一直保持半开的状态,声门前部完全靠拢,后部的气声门有一个宽三角裂隙,声带不振动,从肺部出来的气流通过开放区产生摩擦噪声,故声源为噪声源。由于发耳语音时,伪声带区域变窄、声门保持半开的状态使得声道增加了气管和肺部分,产生附加的零极点,改变了声道传输函数,故耳语音与正常音的韵母部分有着较大的差别。币常语音”0”时域波形o.20一._⋯1_l‘‘“1.篓。一一一』一一~、嚣。≯·∥一泖

3、“:_1.≥“‘一~1⋯~⋯一、襄4≯I黑量12工.一邑2嚣圈-瓣溺..爨1级,。0⋯翳l‘1’。。。。,一~一,~。茹麓圆黉鬻鳓鬻嘲季l融。,.兰:,=。。。~一t184基于概率神经网络的汉语耳语音识别的研究第二章耳语音的相关知识耳语音”0”时域波形垂N3二∥器耱囊一雕褂黝’。‘骚:盔溢盛盆鬣鬣毯誊滋厶&零::图2.1和图2.2分别是正常语音“0”与耳语音⋯0’的时域波形及窄带语谱图。对正常语音,窄带语谱图中可看到明显的声纹;而耳语音,语谱更像噪声谱。2.2耳语音的声学特性由于耳语音与正常音韵母部分不同的发音

4、机理,使它们表现出不同的声学特性。首先,耳语音的激励源是噪声,声带不振动,耳语音的韵母部分和浊声母部分没有基音频率。其次,由于耳语音是气声发音,其能量比正常发音低约20dB,信噪比很低。正常音的浊音能量大于清音能量、浊音的过零率小于清音的过零率,由于耳语音声韵母都是噪声激励,故没有此规律。另外,由于耳语发音时,假声带区域变窄、声门保持半开的状态,使得声道增加气管和肺部分,因此声道传输函数发生改变,使得耳语音韵母共振峰的位置和带宽都发生了变化。根据参考文献【6】的研究,正常音的共振峰幅值一般是从FI至UF4依次衰

5、减,耳语音的共振峰幅值没有这样的规律,有些耳语音的第一共振峰幅值要小于第二共振峰幅值。耳语元音500Hz以下的谱被衰减,200Hz一2000Hz的谱较之正常元音的谱更平坦。基于概率神经网络的汉语耳语音识别的研究第二章耳语音的相关知识图2.3是正常语音⋯6’与耳语音⋯6’时域波形以及一帧语音信号的共振峰对比图。图2.4是耳语音“2”的前3个共振峰轨迹曲线。0.040.02时域波形餐。⋯⋯*一—~矾撕-0.02

6、12i_㈣㈣㈣棚州帅m一频率(Hz)图a正常语音⋯6’时域波形及一帧信号的共振峰时域波形0.1~——一—

7、———0.∞l量。卜——^——枷黼懈娜静IIl沁翻黼舟q咿晰w忧州一旬.05}.0.1【一——一02000600080∞1000012∞0采样点使用burg法提取的一帧语音信号的共振峰是:992.1875hz1578.125hz2445.3125hz恻罂图b耳语音⋯6’时域波形及其中一帧的共振峰图2.3正常语音⋯6’与耳语音⋯6’时域波形、共振峰对比图6ijm¨¨ii圳州㈨M==基于概率神经网络的汉语耳语音识别的研究第二章耳语音的相关知识望荸甜繇图2.4耳语音“2”的前3个共振峰轨迹7基于概率神经网络的汉语耳语

8、音识别的研究第三章语音识别的理论基础第三章语音识别的理论基础3.1语音信号产生的声学基础人发声过程如图3.1所示。人通过口、鼻吸气,使自己的肺叶充满空气,肺是胸腔内一团有弹性的海绵状物质,可以存储空气。当人发声时,肺部的空气被压缩,经气管到喉部。声带是位于喉咙中间的两条白色韧带,一般声带的长度为lOmm.14ram。当发声时,气流穿过两条声带间的缝隙,声带自然闭合靠拢,成水平状;当气流被阻断时,声带间就产生缝隙,从而产生一股准周期的脉冲,使声带产生振动。用上述方式所发出的声音称为“浊音”。随后气流通过声道,声道

9、就像是一个具有谐振特性的腔体,输出特性既与基音频率有关,也与声道本身特性有关例。当激励源不是由声带振动产生的脉冲,而是由空气湍流产生,发出的音就称为“清音”,这时激励源类似于白噪声,最后通过声道的气流通过口唇或者鼻腔向外发出。浊音图3.1语音产生的物理模型3.2语音信号产生的数字模型根据语音产生器官的组织结构,结合信号处理理论,画出如图3.2所示的语音信号产生的数字模型。8基于概率神经

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。