中英双语混合语音识别研究

中英双语混合语音识别研究

ID:31653440

大小:78.18 KB

页数:6页

时间:2019-01-16

中英双语混合语音识别研究_第1页
中英双语混合语音识别研究_第2页
中英双语混合语音识别研究_第3页
中英双语混合语音识别研究_第4页
中英双语混合语音识别研究_第5页
资源描述:

《中英双语混合语音识别研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、中英双语混合语音识别研究张晴晴,潘接林,颜永红(中国科学院声学研究所中科信利实验室,北京100080)摘要:介绍了针对歌曲检索中出现的中英混合现象所开发的中英双语识别系统。在双语混合语音识别中,主要而临的2个问题:①在保证双语识别率的前提下控制系统的复杂度;②有效处理插入语中原用语引起的非母语匚音现彖。为了解决双语混合现彖以及减少统计建模所需的数据量,通过音索混合聚类方法建立起一个统一的双谁识别系统。在聚类算法中,提出了一种新型基于混淆矩阵的两遍音索聚类算法(TOVI),并将该方法与基于声学他然度准则的聚类方法进行了比较。实验结果表明:利用TCM进行

2、音索聚类的识别性能优丁•基丁•声学似然度音索聚类的性能,故终得到的中英双语识别系统在纯英文测试集上的短语错误率(PER)相对基线单英文识别系统下降7.19%;在双语混合测试集上PER相对基线混合模型下降1378%;同时在纯中文测试集上保持了基线单中文认别系统的性能。关键词:双语识別;聚类算法;口适应中图分类号:1N93文献标识码:A文章编号:1673囚25X(2008)041)3912)6DevelopmentofaMandarhEnglishbilhgualspeechrecognitbnsystemZHANGQingming,FANJie21in

3、,VANYong2hong(TliinkrTSpeechLabora^iyInstituteofAcousticsofChineseAcademyofSciences,Beijing100080,RR.China)Abstract:TheMandarin2EnglishbilingualspeechrecognitbnsystemwhichhasbeendevebpedfortheMandarin2EnglishphenanenoninsongretrievalisintroducedThemaindiilicultiest)handlethebi

4、lingualspeechrecognitfonforrealworldapplicatbnarefocusedonfcvoajpects:thefirstisk)balancethepeiibimanceoninterandintni・sententiallanguage»vitc2hingandloreducethecomplexityofthebilingualspeechrecognitbnsystem;thesecondisloefleelivelydealwiththema2trixlanguageaccentsinembeddedlan

5、guageInoixlerloprocesstheintra2sententiallanguageavitchingandreducethea2mountofdatarequirediolobustlyestinatestatisticalmodels,insteadofusingbvoseparatemonolingualmodelsidreachlan2guage,acompactsinglesetofbilingualacousticmodelderivedbyphonesetmergingandclusteringisdevebpedHenc

6、e,aiK)ve1IVvo巾assplioneclusteringmeIhodbasedonConfusbnMatrix(TCM)ispresentedandcanparedwiththebg21ike11hoodmeasuremethodExpermentstestifythatTCMcanachievebelterperfbimanceThephraseeriorrate(PER)oiMESRSibrEnglishutteranceswasreducedby7.19%ivlalivelycomparedIdthebasclinemonolingu

7、a1EnglishsystemvhikthePERonMandarinutteranceswascanparablctothatofthebaselinemonolingualMandariiisystanThepcrfoimanccforbilingualutterancesachieved1378%relativePERreductbnKeywords:bilingualspeechrecognitbn;clusteringalgorithn;adaptatbn0引言随着现代社会信息的全球化,双语以及多语通收稿日期:20081)3217基金项目

8、:国家高技术研究发展计划(“863”计划,2006AA010102,2006AA01Z195);国家重点基础

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。