《数字语音处理》PPT课件

《数字语音处理》PPT课件

ID:41875090

大小:1.44 MB

页数:75页

时间:2019-09-04

《数字语音处理》PPT课件_第1页
《数字语音处理》PPT课件_第2页
《数字语音处理》PPT课件_第3页
《数字语音处理》PPT课件_第4页
《数字语音处理》PPT课件_第5页
资源描述:

《《数字语音处理》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数字语音处理李香春《数字语音处理》教学大纲课程名称:数字语音处理课程英文名称:DIGITALSPEECHPROCESSING总学时:32讲课学时:32学分:2开课单位:信息学部通信工程系授课对象:电子信息工程专业及通信工程专业先修课程:信号与系统数字信号处理基础《数字语音处理》教学大纲教材:《数字语音处理》,姚天任编,华中科技大学出版社,1992教学参考书:《语音信号数字处理》,杨行峻、迟惠生编,电子工业出版社《语音信号处理》,易克初等编,国防工业出版社,2000教学目的:本课程作为本科生的一门

2、选修课,主要向学生系统地介绍语音信号处理中的基本理论、方法,包括:语音信号的编码压缩技术、语音识别技术、语音合成技术。通过本课程的学习使学生掌握本课程的基本方法,开阔视野,为今后从事相关的研究开发工作奠定基础。学时安排第一章绪论(共1学时) 语音信号处理的发展历史,语音信号处理的分类,语音识别技术的分类。第二章语音信号产生的数字模型(共2学时) 发音器官的生理、语音信号的产生模型第三章语音波形的数字编码(共4学时) 语音编码的基本方法,子带编码。第四章短时时域处理技术(共4学时)短时能量、短时平

3、均幅度、短时平均过零率、短时自相关函数学时安排第五章短时傅里叶分析(共4学时)第六章语音信号的线性预测(共3学时)线性预测分析基本原理,基于自相关的线性预测分析。第七章语音信号的同态预测和倒谱分析(共4学时)第八章矢量量化(共4学时)矢量量化的基本原理、特征矢量及畸变准则的选择,LBG算法。第九章隐马尔科夫模型(共4学时)第十章数字语音处理的应用(共2学时)考核方式方式1:平时:小测验4次,占总成绩的70%-80%期末:总结报告,占总成绩的20%-30%方式2:平时:报告1份,占总成绩的20%-

4、30%期末:闭卷考试,总成绩的70%-80%1.绪论语音信号处理的研究内容语音信号处理的发展历史讲授内容语音信号处理的研究内容语音信号的数字表示方法波形表示:参数表示:语音信号处理的方法和技术时域、频域和变换域语音信号处理的应用识别、合成、压缩、增强语音信号的数字表示方法如何选择表示方法?保存消息内容便于传输和贮存便于变换和处理不能严重损害消息内容波形表示法波形表示法取样波形表示法量化后的波形参数表示法参数表示法:语音信号看成是某个模型在一定激励作用下产生的输出,而激励源和模型的参数便作为语音信

5、号的表示。W=f(A,B)A激励,B模型参数例:产生“信息学部”的语音信号W=f(信息学部,140)语音信号处理的方法和技术时域(时变信号,但短时平稳)短时处理技术短时能量短时平均过零率短时自相关频域短时傅里叶分析变换域小波变换语音信号处理的应用语音压缩和编码:语音通信数字化;语音合成:自动报站、自动报时、自动警告、电话自动查询和语音提示等;语音识别:声控应用、自动口语翻译;说话认识别:安全加密、银行信息电话查询服务以及破案和法庭取证;语音增强:通常作为语音处理的前端。1874年电话的发明,贝尔

6、(Bell);1939年声码器的研制成功—语音是由人的声带振动而产生的声源(载波)受到运动的声道控制(调制)产生的;语音处理的发展历史(1)语音处理的发展历史(2)1947年贝尔实验室发明语谱图仪—语音信号研究的开始;一男性说“欢迎光临”的宽带语谱图语音处理的发展历史(3)50年代第一台口授打字机和英语单词语音识别器;60年代出现了第一台以数字计算机为基础的孤立词语音识别器和有限连续语音识别器;70年代动态规划技术、隐马尔可夫模型、线性预测技术和矢量量化码书生成方法用于语音编码和识别;80、90

7、年代语音处理技术产品化—IBMTangora-5和Tangora-20英语听写机,DragonDictate词汇翻译系统(70000),汉语听写机。CMU语音组研制成功SPHINX系统(997,95.8%);国内,清华大学、中科院声学所和中科院自动化所在汉语听写机研究方面有一定成果。讲授内容语音信号产生的数字模型语音信号处理方法语音波形编码方法短时处理方法(时频域)线性预测、倒谱、矢量量化隐含马尔科夫模型(HMM)语音信号处理的应用语音压缩、合成、识别、增强2.语音信号产生的数字模型人类语音的产

8、生过程复杂信息丰富多样至今尚未找到理想模型来描述语音产生过程Fant于1960年提出的线性模型是模拟语音主要特征的比较成功的模型之一人类发音的生理过程语音信号的声学特性2.1人类的语言器官人体发音器官—肺、气管、喉(包括声带)和声道肺是语音产生的能源所在;声带为产生语音提供主要的激励源;声道是指声门至嘴唇的所有器官:咽、鼻腔、口腔等,它们具有非均匀截面,且随时间变化,起共鸣器(或谐振器)的作用。人类的语言器官(a)闭合状态-浊音(b)张开状态-清音甲状腺软骨2.2语音产生过程(1)浊音产生机理浊

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。