甚低速率波形内插语音编码分析

甚低速率波形内插语音编码分析

ID:33009771

大小:2.45 MB

页数:52页

时间:2019-02-19

甚低速率波形内插语音编码分析_第1页
甚低速率波形内插语音编码分析_第2页
甚低速率波形内插语音编码分析_第3页
甚低速率波形内插语音编码分析_第4页
甚低速率波形内插语音编码分析_第5页
资源描述:

《甚低速率波形内插语音编码分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、北京工业大学工学硕士学位论文于语音模型,提取并编码模型中的特征参数。混合编码结合了二者的长处,在4---16kb/s速率能够得到较高质量的合成语音。本文重点讨论的波形内插属于参数编码的范畴,它依赖于对语音的建模,下面就介绍一下语音的产生过程及其建模原理。1.2.1语音的产生过程及其模型语音信号是由来自肺部的空气流经过声带后激励声道,最后从嘴唇或鼻孔或同时从嘴唇和鼻孔辐射出来而产生的【Il。按其激励形式的不同可将语音分为:浊音、清音和爆破音。浊音是由声门处的准周期脉冲序列经过声道从嘴唇辐射而产生,清音的激励源

2、则是位于声道某个收缩区的空气湍流,如果声道是在完全闭合的情况下突然释放产生的语音则为爆破音。根据对语音产生机理的分析,图1.1所示的数字模型描述了语音信号的产生过程【l,l41,它包含三个部分:激励源、声道模型和辐射模型。其中,清音由白噪声发生器来产生,浊音信号由周期脉冲发生器来产生;声道模型矿(z)是时变滤波器,通常采用全极点模型描述;增益因子以和4,分别用于调节浊音语音和清音语音的幅度。可以说此模型的建立极大程度地满足了语音压缩编码的需要,仅需要很少的比特信息来描述语音信号的传输参数,最终产生清晰可懂的

3、合成语-e,-目。基音周期清音图1-1语音信号产生的模型1.2.2语音压缩编码的理论依据按照信息论的观点,语音压缩编码的码率可以做到150b/s~60b/s。由此可见,语音压缩编码的工作空间还很大【151。一方面,语音信号中含有大量的冗余信息。-2-第1章绪论体现在:(1)语音信号样本间强相关特性,即短时谱不平坦。理论上可以通过滤波去除冗余,大多数波形编码技术就是利用这一特性,从频谱平整化着手处理的。(2)浊音语音段具有准周期特性。(3)声道的形状及其变化的速率有限。这是语音信号采用分帧处理方法的理论依据,

4、它允许声道滤波器参数或谱包络等按帧处理,同时通过一定的手段去除帧间的相关性。(4)传输码值的概率分布非均匀。去除此种冗余信息,通常是与所采用的编码方法有关,当传输的码率已被设定时,语音编码器的合成语音质量将通过有效地利用这些冗余度而达到最佳。另一方面,可以利用人耳的听觉心理特性【l5。,主要体现在:(1)人耳对不同频段的声音敏感程度不同,通常对低频比对高频敏感一些。“子带编码技术”是对此种特性的成功应用。(2)人耳对语音信号的相位不敏感,在低速率语音编码中表现在几乎不为相位因子分配码字。(3)人耳有“掩蔽”

5、效剧14’l5。,即一个强音能抑制一个同时存在的弱音的听觉现象,对人耳听不到或极不敏感的声音分量可以看作是冗余。利用这一特性,通常采用一些准则来改变量化噪声的频谱形状,使得量化噪声在主观听觉上能部分或全部被语音所屏蔽;或在后滤波技术中利用谱幅度的适度失真来降低量化噪音对语音质量的影响。语音压缩编码的本质就是设法去掉这些冗余信息,从而达到压缩比特率的目的。采用各种信源编码技术减少语音信号的冗余度,并充分利用人耳的听觉特性,可以在压缩语音信号编码速率的同时,恢复出具有很好可懂度和较好自然度的合成语音。1.2.3

6、语音编码的基本属性语音编码器的性能主要由四个方面的因素来衡量,包括:编码速率、编码质量、算法复杂程度以及编解码延时【l】。这四个因素即相互关联又相互矛盾,在不同的应用环境下要折衷考虑这四个基本属性。1)语音质量重建语音信号的质量是衡量语音编码算法优劣的关键性能之一。评价方法有客观评价法和主观评价法两种。客观评价法建立在重建语音波形与输入语音波形匹配的基础上,它不能很好地反应人耳对语音质量的感知,在速率为16kb/s以下的中低速率语音编码中这个问题显得尤为突出。所以在实际应用中多采用主观评价法来评判编码器的语

7、音质量。主观评价法在国际上常用的有主观A/B测试,判断韵字测试(DRT)、判断满意度测量(DiagnosticAcceptabilityMeasure,DAM)、平均意见得分(MOS)等。2)编码速率编码速率反映的是编码器对语音信号的压缩程度,通常用比特/秒(b/s)来北京工业大学工学硕士学位论文表示编码器每秒所消耗的比特信息。语音编码从传输速率的角度可以划分为:高速率(16kb/s~128kb/s)语音编码、中速率(4.8kb/s~16kb/s)语音编码、低速率(1.2kb/s~4.8kb/s)语音编码和

8、甚低速率(1.2kb/s以下)语音编码【l51。高速率语音编码具有适应能力强、话音质量好、抗噪性能强等优点。中速率语音编码一般采用波形编码或混合编码方法,在移动通信中应用比较广泛。低速率以及甚低速率语音编码常采用参数编码方法,在短波信道、水声信道等对信源速率要求极其苛刻的应用场合,有极其重要的研究意义。3)算法复杂度编解码算法的复杂度与计算机硬件的实现密切相关,目前,许多语音编解码算法都采用DSP芯片来实现。算法

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。