数字语音处理及MATLAB仿真.rar 第九章.ppt

数字语音处理及MATLAB仿真.rar 第九章.ppt

ID:50916734

大小:3.26 MB

页数:51页

时间:2020-03-15

数字语音处理及MATLAB仿真.rar 第九章.ppt_第1页
数字语音处理及MATLAB仿真.rar 第九章.ppt_第2页
数字语音处理及MATLAB仿真.rar 第九章.ppt_第3页
数字语音处理及MATLAB仿真.rar 第九章.ppt_第4页
数字语音处理及MATLAB仿真.rar 第九章.ppt_第5页
资源描述:

《数字语音处理及MATLAB仿真.rar 第九章.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第九章语音合成9.1概述19.2语音合成的原理及分类9.3共振峰合成法39.4线性预测参数合成法49.5基音同步叠加法59.6文语转换系统629.1概述语音合成是人机语声通信的一个重要组成部分,解决让机器像人那样说话的问题。最早的合成器是1835年由W.vonKempelen发明,经Weston改进的机械式会讲话的机器。而最早的电子式语音合成器也是1939年HomerDudley发明的声码器,它不是简单的模拟人的生理过程,而是通过电子线路来实现基于语音产生的源-滤波器理论。在语音合成技术发展中,早期研究主要是采用参数合成方法。1990年提出的基音同步叠加PSOLA方法,使基

2、于时域波形拼接方法合成的语音音色和自然度大大提高。我国的汉语语音合成研究从80年代初就基本上与国际研究同步发展。大致也经历了共振峰合成、LPC合成到应用PSOLA技术的过程。9.2语音合成的原理及分类9.2.1波形合成法波形编码合成法是一种波形合成法,类似于语音编码中的波形编解码方法,该方法直接把要合成的语音的发音波形进行存储或者进行波形编码压缩后存储,合成重放时再解码组合输出。特点:所需的存储容量太大,词汇量不能很大;相对简单,通常只能合成有限词汇的语音段。目前用于自动报时、报站和报警等。另一种波形合成法是波形编辑合成,它把波形编辑技术用于语音合成,通过选取音库中采取自然

3、语言的合成单元的波形,对这些波形进行编辑拼接后输出。它采用语音编码技术,存储适当的语音基元,合成时,经解码、波形编辑拼接、平滑处理等输出所需的短语、语句或段落。9.2.2参数合成法参数合成法也称为分析合成法。参数合成法有:发音器官参数合成和声道模型参数合成。发音器官参数合成法:是对人的发音过程直接进行模拟。它定义了唇、舌、声带的相关参数,如唇开口度、舌高度、舌位置、声带张力等,由发音参数估计声道截面积函数,进而计算声波。缺点:合成语音的质量不理想。参数合成方法的优点:音库一般较小,并且整个系统能适应的韵律特征的范围较宽,这类合成器比特率低,音质适中。缺点:算法复杂,参数多,

4、并且在压缩比较大时,信息丢失亦大,合成出的语音总是不够自然、清晰。为了改善音质,近几年发展了混合编码技术,以改善激励信号的质量。9.2.3规则合成法规则合成方法:一种高级的合成方法,通过语音学规则产生语音,可以合成无限词汇的语句。合成的词汇表不是事先确定,系统中存储的是最小的语音单位的声学参数,以及由音素组成音节、由音节组成词、由词组成句子和控制音调、轻重音等韵律的各种规则。算法中,用于波形拼接和韵律控制的较有代表性的算法是基音同步叠加PSOLA技术。9.2.3规则合成法基音同步叠加PSOLA技术主要特点:在语音波形片断拼接之前,首先根据语义,用PSOLA算法对拼接单元的韵

5、律特征进行调整,使合成波形既保持了原始语音基元的主要音段特征,又使拼接单元的韵律特征符合语义,从而获得很高的可懂度和自然度。项目波形合成方式参数合成方式按规则合成方式语音质量可懂度高高中自然度高中低词汇量小(500字以下)大(数千字)无限合成方法PCM,ADPCMLPC,LSP,共振峰LPC,LSP共振峰数码率9.6~64kbit/s2.4~9.6kbit/s50~75kbit/s1兆比特可合成的语音长度15秒~100秒100秒~7分无限合成基元音节、词组、句子音节、词组、句子音素、双音素、音节装置简单比较复杂复杂硬件主体存储器存储器和处理器处理器表9.1三种语音合成方式的

6、比较9.3共振峰合成法共振峰合成理论中声道参数、声道谐振特性一直是研究的重点。共振峰合成模型是把声道视为一个谐振腔,利用腔体的谐振特性,如共振峰频率及带宽,以此为参数构成一个共振峰滤波器。因为音色各异的语音有不同的共振峰模式,以每个共振峰频率及其宽带为参数,可以构成一个共振峰滤波器。9.3共振峰合成法共振峰语音合成器的构成原理:将多个共振峰滤波器组合起来模拟声道的传输特性,对激励声源发生的信号进行调制,经过辐射得到合成语音。基于共振峰的理论有三种实用模型。9.3.1级联型共振峰模型在该模型中,声道被认为是一组串联的二阶谐振器,共振峰滤波器首尾相接,其传递函数为各个共振峰的传

7、递函数相乘的结果。激励源V1V2----V5辐射模型语音G一个五个极点的共振峰级联模型如下图9.2共振峰级联模型五个极点的共振峰级联模型传递函数为:即:式中,G为增益因子。9.3.2并联型共振峰模型在并联型模型中,输入信号先分别进行幅度调节,再加到每一个共振峰滤波器上,然后将各路的输出叠加起来。其传递函数为:上式可分解成以下部分分式之和:其中Al为各路的增益因子。下图就是一个M=5的并联型共振峰模型。激励源+辐射模型语音图9.3并联型共振峰模型9.3.3混合型共振峰模型比较以上两种模型,对于大多数的元音,级联型合乎

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。