基于深度学习的藏语拉萨方言语音识别的研究

基于深度学习的藏语拉萨方言语音识别的研究

ID:35181416

大小:3.73 MB

页数:56页

时间:2019-03-21

基于深度学习的藏语拉萨方言语音识别的研究_第1页
基于深度学习的藏语拉萨方言语音识别的研究_第2页
基于深度学习的藏语拉萨方言语音识别的研究_第3页
基于深度学习的藏语拉萨方言语音识别的研究_第4页
基于深度学习的藏语拉萨方言语音识别的研究_第5页
资源描述:

《基于深度学习的藏语拉萨方言语音识别的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、戶.取堪it.:V方分类号灌波—/IUDC^编号10736巧瓜卸莊少孽-f工程硕±学位论文^^私:,1f基于深度学习的藏语粒萨方言L—、{语音识别的却究參'J^■/'^/I/^4^Iy'研究生姓名j:张宇聪指导教师姓名、职称:杨鸿武教授’,?普专业名称:电子与通信工程■■.f.研究方向:语音信号处理*呼著-1二〇六年五月—,户)r3独创性巧明本人声明所呈交的论文是我个人在导师指导下进行的

2、研究工作及取得的研巧成果。尽我所知,除了文中特别加|^>1标注和致谢的地方外,论文中不包括其他人己经发表或撰写过的研究成果,也不包含为获得西北师范大一学或其他教育机构的学位或证书而使用过的材料。与我同工作的同志对本研巧所做的任何贡献均己在论文中作了明确的说明并表示了谢意。^与舉)。k、签名、化■乏:日期:关于论文使用授权巧说明本人完全了解西北师范大学有关保留、使用学位论文的规定,即;学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可公布论。文的全部或部分内容,可采用影巧、缩印或其他复制手段保

3、存论文’签名红办"-L;导师寐名;才旬i刮曰期;硕士学位论文M.D.Thesis基于深度学习的藏语拉萨方言语音识别的研究ResearchonTibetanLhasadialectspeechrecognitionbasedondeeplearning张宇聪ZHANGYucong二○一六年五月西北师范大学工程硕士学位论文摘要让机器听懂人类的话、根据人类的命令完成工作,这是许多科研人员多年来的努力方向。近些年随着计算机计算能力的提高以及大数据的出现,深度学习算法在各个领域取得了广泛的应用。深度学习网络是一种含有多隐含层的人工神经网络,在提取

4、特征时,具有比传统声学特征提取器更好的表达能力。许多研究已经将深度学习算法应用到了语音识别系统当中,但是这种深度学习算法目前只应用于主流语言的语音识别中,还没有引入到藏语等少数民族语言的语音识别中。本文在藏语拉萨方言语音识别中引入深度学习算法,设计了面向藏语语音识别的语料库,采用深度学习模型--长短时记忆网络模型作为藏语声学特征提取器,然后应用隐马尔可夫模型(HiddenMarkovModel,HMM)进行识别。论文主要工作与创新如下:1.建立了一个面向藏语语音识别的藏语语料库。首先设计了一个包含51个藏语常见字的文本语料,在对比了藏语与汉语的

5、发音特点后,借助现有的汉语普通话标注方案SAMPA-SC,设计了藏语拉萨方言标注方案SAMPA-T,最后对藏语语料进行了录音和标注(4人参与录音,每人每个字读30遍,共6120个样本)。2.搭建了一个基于深度学习网络的藏语声学特征提取器。采用深度学习模型--长短时记忆(LongShortTermMemory,LSTM)网络模型,并将这种网络应用在藏语语音识别当中作为声学特征提取器。利用该网络输出语料库中51个字的后验概率,并将这51维输出激活与39维MFCC特征结合后经过PCA(PrincipalComponentAnalysis)算法降维,提

6、取最重要的40维Tandem特征,然后将这些特征输入给HMM进行训练与识别。3.实现了结合长短时记忆网络与HMM的藏语语音识别。应用长短时记忆网络作为藏语声学特征提取器,然后应用HMM进行藏语识别。实验结果表明,在本文建立的语料库测试集中,本文提出的藏语语音识别方法能够达到80.56%的识别率。关键词:藏语语音识别;深度学习;长短时记忆网络;隐马尔可夫模型;Tandem特征I基于深度学习的藏语拉萨方言语音识别的研究AbstractResearchershavebeenworkingformanyyearstomakemachinestounde

7、rstandhumanlanguageandactascommanded.Inrecentyears,deeplearningalgorithmshavebeenwidelyusedinvariousareaswiththeimprovementofcomputercalculatingabilityandtheemergenceofbigdata.Deeplearningnetworkisakindofartificialneuralnetworkthatcontainsmanyhiddenlayers.Deeplearningnetwork

8、isbetterthanthatofthetraditionalacousticfeatureextractorsinextractingacoust

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。