连续语音识别系统的研究与实现

连续语音识别系统的研究与实现

ID:35099231

大小:6.47 MB

页数:68页

时间:2019-03-17

连续语音识别系统的研究与实现_第1页
连续语音识别系统的研究与实现_第2页
连续语音识别系统的研究与实现_第3页
连续语音识别系统的研究与实现_第4页
连续语音识别系统的研究与实现_第5页
资源描述:

《连续语音识别系统的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文论文题目:连续语音识别系统的研究与实现作作作者者者姓姓姓名名名鲁鲁鲁泽泽泽茹茹茹指指指导导导教教教师师师李李李刚刚刚教教教授授授学学学科科科专专专业业业电电电子子子与与与通通通信信信工工工程程程培培培养养养类类类别别别全全全日日日制制制专专专业业业学学学位位位硕硕硕士士士所所所在在在学学学院院院信信信息息息工工工程程程学学学院院院提提提交交交日日日期期期2016年年年10月月月18日日日浙浙浙江江江工工工业业业大大大学学学硕硕硕士士士学学学位位位论论论文文文连连连续续续语语语音音音识识识别别别系系系统统统的的的研研研究究究与与与实实实现现现作作作者者者姓姓姓名名

2、名:::鲁鲁鲁泽泽泽茹茹茹指指指导导导教教教师师师:::李李李刚刚刚教教教授授授浙浙浙江江江工工工业业业大大大学学学信信信息息息工工工程程程学学学院院院2016年年年10月月月DissertationSubmittedtoZhejiangUniversityofTechnologyfortheDegreeofMasterResearchonandImplementationofContinuousSpeechRecognitionSystemCandidate:LuZeruAdvisor:Prof.LiGangCollegeofInformationEngineeringZ

3、hejiangUniversityofTechnologyOct.2016浙江工业大学学位论文原创性声明,独立进行研巧本人郑重声明:所提交的学位论文是本人在导师的指导下工作所取得的研巧成果。除文中己经加标注引用的内容外,本论文不包含其他个人或集体已经发表或撰写过的研究成果,也不含为获得浙江工业大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡献的个人和。集体,巧己在文中明确方式标明。本人承担本声明的法律责任作者签名:备峰疋心日期:年月女日学位论文版权使用授权书本学位论文作者完全了解学校有关保留,同意学校、使用学位论文

4、的规定保留并向国家有关部口或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权浙江工业大学可将本学位论文的全部或部分内容编入有关数据库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于一1□。、保密,在年解密后适用本授权书2。、保密□,在H年解密后适用本授权书3、不保密囚^""(请在臥上相应方框内打V)>月r作者签名:^日撕>必年/J日导师签名;日期;兴4年化月r日浙江工业大学硕士学位论文连连连续续续语语语音音音识识识别别别系系系统统统的的的研研研究究究与与与实实实现现现摘摘摘要要要语音

5、识别技术,也被称为自动语音识别(AutomaticSpeechRecognition,ASR),其目标是让机器听懂人类的语言。经过半个多世纪的发展,随着ASR技术研究的不断突破,其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术开发出的产品应用领域非常广泛,如语音拨号、语音文档检索、语音聊天助手,同声翻译、智能家居、医疗服务、工业控制、语音通信系统等,几乎深入到社会的每个行业和各个方面。近些年来,随着Siri的走红,类似Siri、搜狗语音助手这样利用语音实现控制,语义理解的系统开始大量涌现。而ASR作为这类系统的入口,很大程度上决定了这类应用的质量。没有一个好的语

6、音识别系统做支撑,再好的助手也只能是个摆设。所以ASR作为实现人机自由交互的关键技术是非常值得我们深入研究的。本文主要分析研究隐马尔科夫模型(HiddenMarkovModel,HMM)原理和深度神经网络(DeepNeuralNetwork,DNN)原理在语音识别中的应用,并以HMM工具包(HMMToolsKit,HTK)为平台,搭建一个IP语音拨号识别系统。本文所做的工作与贡献总结如下:1.概述语音识别的研究背景与意义以及国内外发展现状。介绍语音信号的预处理,深入研究语音识别中涉及到的关键技术。2.制作语音数据库。编写脚本生成25个随机文本,每个文本包含50句随机IP格式

7、的英文句子,分配给25人(12男13女)录音,共录制1250句。其中1000句作为训练样本(或称为语料),250句作为测试样本。录音数据全部统一采用windows系统中常用的WAV格式保存。3.在HTK平台上搭建一个IP语音拨号系统,使用录制的1000句语料训练出四种类型的模型,单因素HMM模型,三音素HMM模型,绑定状态三因素HMM模型,以及DNN-HMM模型。分别使用这四种模型测试250句样本,对比它们各自的单词识别率和句子识别率,其中DNN-HMM模型的单词和句子识别率在四种模型中均为最高,说明神经网络模型相

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。