人工智能-基于深度学习的语音声学模型的研究

人工智能-基于深度学习的语音声学模型的研究

ID:5184448

大小:403.35 KB

页数:22页

时间:2017-12-05

人工智能-基于深度学习的语音声学模型的研究_第1页
人工智能-基于深度学习的语音声学模型的研究_第2页
人工智能-基于深度学习的语音声学模型的研究_第3页
人工智能-基于深度学习的语音声学模型的研究_第4页
人工智能-基于深度学习的语音声学模型的研究_第5页
资源描述:

《人工智能-基于深度学习的语音声学模型的研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、《人工智能》课程论文题目基于深度学习的语音声学模型的研究院(系)中印计算机软件学院专业:软件工程学号学生姓名任课教师时间4中文摘要随着智能家居、车载语音系统以及各种语音识别软件流行,语音识别逐渐走进人们的视野,凭借其实用性准确性得到了广大用户的喜爱,同时语音识别作为人机交互的重要接口,成为人工智能领域研宄的重点。在大数据的背景下,深度学习得到长足的发展,由于它对海量数据超强的建模能力,被广泛应用与图像、语音识别,并取得了惊人的效果。考虑到理论意义和实用价值,在深度学习的基础上研究语音识别是一个可行的方向。

2、深度学习是一种多层非线性变换网络,通过大量的有监督参数调整计算来建模数据间的复杂关系。本文详细介绍了语音识别以及深度学习的基本原理,然后阐述了怎样将深度学习高效的应用与语音识别中。1、基于深度神经网络的声学特征提取研究深度神经网络是一种有监督训练的多层网络,主要用于分类问题,但是截取它的一部分训练好的网络用于特征转换,新生成的特征在语音识别上相比于MFCC特征也有很好的表现。本文主要从深度神经网络的预训练、参数调整、系统优化方面进行了研宂,并在Kaldi平台上搭建了用于语音特征提取的深度神经网络,从MFC

3、C特征中提取鲁棒性区分性更强的语音特征,并用这些新特征训练基于GMM-HMM的声学模型搭建语音识别系统,最好的DNN网络与原始MFCC训练的声学模型搭建的系统相比,在词错误率和句错误率上下降了1.98%和4.21%2、基于深度神经网络的声韵母属性提取研究声韵母属性属于语音属性的一种,它可以看做是语音识别中比声韵母更小的基元,用这种粒度更小的基元更能细致的描述语音现象,而且这种方法在以前语音基于概率统计的基础上加入了语音知识的东西,提高系统的识别性能。本文主要研究了语音属性的基础理论,并从语音属性的提取入手

4、,结合了深度学习的原理,搭建了语音属性提取器,用提取出的语音属性搭建了基于GMM-HMM和基于DNN-HMM的声韵母识别器,通过与MFCC搭建的声韵母识别器比较,在声韵母识别率上分别有0.65%和1.37%的提升,通过与MFCC搭建的语音识别器比较,在词识别错误率上有5.61%的下降。关键字:语音识别,深度学习,特征提取,深度神经网络。4AbstractAssmarthome,carvoicesystemandavarietyofvoicerecognitionsoftwareispopular,spee

5、chrecognitiongraduallycomeintopeople'smind,withitseasy-to-useandhighaccuracythetechniquewasacceptedbythevastnumberofusers,atthesametimespeechrecognitionasanimportantinterfaceofhuman-computerinteractionbecomethefocusofthefieldofartificialintelligenceresear

6、ch.Underthebackgroundofbigdata,deeplearninggetrapiddevelopment,duetothestrongmodellingpowerforhugeamountsofdata,itwasappliedinspeech,imagerecognition,andastonishingresultshavebeenachieved.Consideringthetheoreticalsignificanceandpracticalvaluespeechrecogni

7、tionbasedondeeplearningisafeasibledirection.Deeplearningisessentiallyakindofnetworkwhichtakesadvantageofmulti-layernonlineartransformation.It'susefulinmodelingcomplexrelationshipsamongdatathroughitssupervisedparameteradjustmenttraining.Thispapersummarized

8、thepresentresearchsituationandbasicprincipleofspeechrecognition,thenelaboratedbasictheoryandthenetworkmodelofdeeplearning,andthenfocusesonhowtofullyutilizethepotentialofdeeplearningtheoryinspeechrecognitionresearch.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。