基于频谱上下文的语音识别及情感分类算法研究

ID：37089456

大小：3.23 MB

页数：66页

时间：2019-05-17

资源描述：

《基于频谱上下文的语音识别及情感分类算法研究》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、学校代码：１〇６９７分类号：ＴＰ３９１３１４３９：２０１５密级：公开学号＿颀士专业字位ｉ２文ＤｉｓｓｅｒｔａｔｉｏｎｆｏｒｔｈｅＰｒｏｆｅｓｓｉｏｎａｌＤｅｇｒｅｅｏｆＭａｓｔｅｒ泉于频谱上下文的语音识别及情感分类算法研究学科名称：电子与通信工程专业学位类别：工程颂士指导老师：曹正文教授作者：张晓西北大学学位评定委员会二〇一八年六月SpeechRecognitionandEmotionClassificationAlgorithmBasedon

2、SpectralContextFeatureAthesissubmittedtoNorthwestUniversityinpartialfulfillmentoftherequirementsforthedegreeofMasterinElectronicsandCommunicationEngineeringByZhangXiaoSupervisor:CaoZhengwenProfessorJune2018摘要摘要语音识别系统经过多年的发展已经在很多场合取得了良好的应用效果，但是普及程度并不理想。特定环境

3、下搭建的语音识别系统，在实际复杂应用场景中往往很难实现有效的识别结果。由于背景噪声干扰、说话人情绪变化以及信道畸变等因素的影响，使得实验室环境下训练好的语音识别系统在实际应用中性能急剧恶化，难以达到令人满意的结果。本文根据语音识别及情感分类中一些关键步骤和上述研究现状及难点，着重对噪声干扰和情绪变化下的语音识别系统进行研究。主要内容包括：（1）提出一种基于上下文特征描述符的特征提取方法。在噪声环境下以及不同情感环境中，传统语音特征难以提供有效的动态信息。因此，本文构建出一种频谱序列的上下文（SSC）的

4、特征方法，对比传统的动态信息处理方式，系统性能有显著的提高，在噪声环境及语音情感识别中都取得了良好的效果。而且在其他频谱过程中都可引入此特征，方法具有一定的普适性。（2）研究噪声环境下的语音识别，提出一种基于递归图压缩距离的语音识别算法。语音信号作为一个随时间变化的序列，通过研究递归图模型在时间序列中的显著作用，将语音特征序列进行递归图压缩，利用MPEG-1压缩算法计算不同递归图之间的CK-1距离，完成整个语音识别过程。（3）研究情绪变化中的分类决策，提出一种基于多特征深度置信网络的语音情感识别算法。针对不

5、同特征对情感描述能力的不同，我们提取多种鲁棒的低级特征，然后将其馈入DBN网络中提取高层特征描述符，进而采用集成学习的思想，对ELM分类结果投票融合，在三种公开数据集上证明了本文算法的有效性。关键词：语音识别，语音情感识别，频谱上下文，递归图压缩距离，多特征融合IABSTRACTABSTRACTAfteryearsofdevelopment,speechrecognitionsystemshavehadmanypromisingapplications,buttheirpopularityisnotidea

6、l.Inpracticalapplications,speechrecognitionsystemsinspecificenvironmentsareoftendifficulttoachieveeffectiverecognition.Itisdifficulttoachievesatisfactoryresultsfromtheinterferencewithotherfactorswhichthespeechrecognitionsystemwastrainedbylaboratoryenvironm

7、ent,suchasbackgroundnoise,speaker'semotionalchanges,channeldistortion,etc.Basedonthekeystepsofspeechrecognitionandemotionclassification,andinlightoftheaboveresearchstatusanddifficulties,thispaperfocusesontheresearchofrecognitionsysteminnoisyenvironmentande

8、motionalenvironment.Themaincontentsinclude:(1)Spectrumsequencecontext(SSC)featureisproposed.Inthenoiseenvironmentanddifferentemotionalenvironments,thetraditionalspeechfeaturesaredifficulttoprovideeffectivedyn

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 66



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于频谱上下文的语音识别及情感分类算法研究

基于频谱上下文的语音识别及情感分类算法研究

相关文章

相关标签