语音识别输入系统设计

语音识别输入系统设计

ID:29475939

大小:774.54 KB

页数:50页

时间:2018-12-20

语音识别输入系统设计_第1页
语音识别输入系统设计_第2页
语音识别输入系统设计_第3页
语音识别输入系统设计_第4页
语音识别输入系统设计_第5页
资源描述:

《语音识别输入系统设计》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊毕业设计(论文)报告纸目录目录1第一章语音识别简介31.1语音识别的研究历史及现状31.2语音识别系统的分类41.3语音识别系统的基本原理41.4语音识别的基本构成51.5语音识别的几种基本方法51.5.3改进的HMM-DDBHMM61.5.4人工神经元网络(ANN)71.6语音识别技术面临的技术难点及对策7第二章语音信号的预处理82.1概述82.2分帧102.3预加重112.4加窗122.4.1窗函数的定义122.4.2窗函数的三种主要类型122.4.3窗函数的

2、选择13第三章端点检测143.1端点检测概述143.2短时能量153.3短时过零率153.4双门限端点检测163.5程序实现173.5.1计算短时过零率173.5.2计算短时能量173.5.3端点的截取18第四章语音识别参数提取224.1LPC和LPCC系数224.1.1lpc及lpcc系数的简介224.1.2lpc系数的基本计算原理234.2MFCC系数24第五章DTW算法实现275.1模式的匹配275.2DTW算法原理285.3DTW算法改进305.3.1搜索宽度限制305.3.2放宽端点限制30第六章matlab编程结果326.1实验

3、程序文件326.2语音识别仿真结果32结论34致谢35参考文献36附录37共50页第50页┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊毕业设计(论文)报告纸1.DTW程序372.DTWTEST程序403.MFCC程序414.TRAIN程序435.VAD程序446.ENFRAME函数程序49共50页第50页┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊毕业设计(论文)报告纸引言语音识别技术就是让机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术,属于多维模式识别

4、和智能计算机接口的范畴。其研究目标是让计算机“听懂”人类口述的语言,这是人类自计算机诞生以来梦寐以求的想法。随着计算机软硬件和信息技术的飞速发展,这种想法更加明显,人们越来越迫切要求摆脱键盘的束缚而代之以语音输入这样便于使用的、自然的、人性化的输入方式。语音识别起源于20世纪50年代AT&T贝尔实验室的Audry系统,它第一次实现了10个英文数字的语音识别,这是语音识别研究工作的开端。60年代,计算机的应用推动了语音识别的发展。这时期的重要成果是提出了动态规划和线性预测分析技术(LP),其中后者较好地解决了语音信号产生模型的问题,对语音识别

5、的发展产生了深远影响。70年代,语音识别领域取得了突破。LP技术得到进一步发展,动态时间归正技术(DTW)基本成熟,特别是提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论,并实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。80年代,实验室语音识别研究产生了巨大突破,一方面各种连接词语音识别算法被开发,例如多级动态规划语音识别算法;另一方面语音识别算法从模板匹配技术转向基于统计模型技术,研究从微观转向宏观,从统计的角度来建立最佳的语音识别系统。进入90年代以后,人工神经网络技术的应用成为语音识别的一条新途径,它具有自适应性、并

6、行性、非线性、鲁棒性、容错性和学习特性,在结构和算法上都显示出了很大的潜力,而且还在细化模型的设计、参数提取和优化,以及系统的自适应技术上取得了关键进展。语音识别技术进一步成熟,语音识别系统从实验室走向实用。语音识别技术是非常重要的人机交互技术,应用语音的自动理解和翻译,可消除人类相互交往的语言障碍。国外已有多种基于语音识别产品如声控拨号电话、语音记事本等已经应用,基于特定任务和环境的听写机也已经进入应用阶段,这预示着语音识别技术有着非常广泛的应用领域和市场前景。随着语音技术的进步和通信技术的飞速发展,语音识别技术将为网上会议、商业管理、医

7、药卫生、教育培训等各个领域带来极大的便利。共50页第50页┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊毕业设计(论文)报告纸第一章语音识别简介1.1语音识别的研究历史及现状语音识别的研究工作始于20世纪50年代,1952年Bell实验室开发的Audry系统是第一个可以识别10个英文数字的语音识别系统。1959年,Rorgie和Forge采用数字计算机识别英文元音和孤立词,从此开始了计算机语音识别。60年代,苏联的Matin等提出了语音结束点的端点检测,使语音识别水平明显上升;Vintsyuk提出了动态编程,

8、这一提法在以后的识别中不可或缺。60年代末、70年代初的重要成果是提出了信号线性预测编码(LPC)技术和动态时间规整(DTW)技术,有效地解决了语音信号的特征提取和不等长语音匹配

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。