声学模型训练系统平台设计和软件实现

声学模型训练系统平台设计和软件实现

ID:33789111

大小:10.05 MB

页数:65页

时间:2019-03-01

声学模型训练系统平台设计和软件实现_第1页
声学模型训练系统平台设计和软件实现_第2页
声学模型训练系统平台设计和软件实现_第3页
声学模型训练系统平台设计和软件实现_第4页
声学模型训练系统平台设计和软件实现_第5页
资源描述:

《声学模型训练系统平台设计和软件实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据硕士专业学位论文声学模型训练系统平台设计和软件实现TheDesignandSoftwareImplementationOfAcousticModelTrainingSystemPlatform作者:陈晓宇导师:陈旭东副教授北京交通大学2014年6月多久点床▲,,1≯万方数据学位论文版权使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索,提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编以供查

2、阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。学校可以为存在馆际合作关系的兄弟高校用户提供文献传递服务和交换服务。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:苻、日芝窘签字日期:力陴年(月27日导师签名:惭划乞签字日期岛,谚年多屈27日万方数据学校代码:10004北京交通大学硕士专业学位论文声学模型训练系统平台设计和软件实现密级:公开TheDesignandSottwareImplementationOfAcousticModelTrainingSystemPlatf

3、orm作者姓名:陈晓宇导师姓名:陈旭东工程硕士专业领域:软件工程学号:12125970职称:副教授学位级别:硕士北京交通大学2014年6月万方数据致谢本论文的工作是在我的导师陈旭东教授的悉心指导下完成的,陈老师严谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢两年来陈老师对我的关心和指导。陈老师悉心指导我们完成了实验室的科研工作,在学习上和生活上都给予了我很大的关心和帮助,在此向陈老师表示衷心的谢意。陈老师对于我的科研工作和论文都提出了许多的宝贵意见,在此表示衷心的感谢。在公司实习

4、工作及撰写论文期间,谢延、苏丹等同事对我论文中的声学模型训练及语音数据存储平台研究工作给予了热情帮助,在此向他们表达我的感激之艉扛1月0另外也感谢家人及我的女友,他们的理解和支持使我能够在学校专心完成我的学业。万方数据北京交通大学硕士专业学位论文摘要语音识别是人工智能领域中的重要研究方向,现有的语音识别技术主要是基于海量语音数据背景下,通过机器学习的相关算法,得到相应的训练结果,也就是声学模型。但由于声学模型训练所需的语音数据的数据量巨大,所以语音数据的存储和声学模型的训练速度便显得尤为重要。论文

5、选题来源于百度网络技术有限公司语音技术部的实际项目声学模型训练系统平台。在该平台投入使用之前,部门的声学模型训练主要是依靠一套伪分布式系统平台,其采用一主多从,硬盘串联的组织形式来实现语音数据的存储和训练算法的并行计算,并以此来提高声学模型的训练速度。但是之前的系统平台在实际应用之中,无论是声学模型的训练速度还是并行计算容错处理等方面并不十分理想。另外,原有系统平台只能完成声学模型训练的任务,而在线语音数据的存储,及后续的语音标注都需要其他系统来完成。这为声学模型的训练及语音产品线的服务都带来不少

6、的不便。论文的主要目的便是设计并实现一套新的声学模型训练的系统平台,在保证训练出来的声学模型准确率不下降的基础之上,提高模型的训练速度和改善并行计算时的容错处理。另外,该平台还将在线语音数据存储的功能整合其中,并为语音标注系统提供友好高效的接口。使其形成一个功能相对完善,便于使用管理的综合系统平台。在提高模型的训练速度和改善并行计算时的容错处理方面,主要是想依靠Hadoop平台及其所实现的MapReduce编程框架。由于Hadoop平台所使用的计算资源为CPU,而声学模型训练算法所使用的计算资源为

7、GPU,所以本文将探究实验Hadoop加GPU的联合。在整合在线语音存储功能方面,将Hadoop的文件系统(HDFS)与MySQL联合使用,改变了以往存储时单一使用MySQL,造成存储性能不佳,存储压力对于MySQL过大的情况,使HDFS和MySQL都能发挥出其优势。另外,整合后的系统平台还为语音标注系统提供了友好高效的接口,并使得标注后的语音数据,不用再费时费力转移到专门用于模型训练的机器之上,在本地集群即可完成训练。论文所述的声学模型训练系统平台投入使用后,声学模型的训练速度及并行计算准确率大

8、大提升,模型的精准度也有小幅度提高。在线语音存储功能采用新的存储方案后,MySQL的工作压力恢复正常,在线语音存储功能运转良好。关键词:声学模型训练系统平台;分布式系统;深层神经网络;在线语音存储;语音标注系统;HDFS;Hadoop;GPU万方数据北京交通大学硕士专业学位论文ABSTRACTABSTRACTSpeechrecognitionisatlimportantresearchfieldinArtificialIntelligence.Basedonthebackgroun

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。