基于语音识别中dtw改进算法的研究

基于语音识别中dtw改进算法的研究

ID:8482743

大小:349.50 KB

页数:5页

时间:2018-03-29

基于语音识别中dtw改进算法的研究_第1页
基于语音识别中dtw改进算法的研究_第2页
基于语音识别中dtw改进算法的研究_第3页
基于语音识别中dtw改进算法的研究_第4页
基于语音识别中dtw改进算法的研究_第5页
资源描述:

《基于语音识别中dtw改进算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于语音识别中DTW改进算法的研究胡金平陈若珠李战明(兰州理工大学,电气工程与信息工程学院,甘肃,兰州,)摘要:动态时间规整(DynamicTimeWarping)是语音识别中的一种经典算法。本文提出了一种改进的端点检测算法,特征提取采用了Mel频率倒谱系数(MFCC),并采用计算量相对较小的改进的动态时间规整(DTW)算法实现语音参数模板匹配,能够实现孤立词、特定人、小词汇量的语音识别,并用MATLAB进行了算法仿真,试验结果表明,改进后的算法,能够有效的提高系统对语音的识别率。关键词:语音识别;端点检测;Me

2、l倒谱参数;动态时间规整中国分类号:TP391.42文献标识码:ADiscussionofDTWProgrammingImprovedWayOnSpeechRecognitionHuJingpingChenRuozhuLiZhanmingAbstract:DynamicTimeWarpingisakindofclassicalprogramminginspeechrecognition.ItadoptstheimprovedendpointdetectionalgorithmandMelfrequenceceps

3、trumcoeffiients(MFCC)tocatchspeechcharacteristicparametersandintroducesdynamictimewrapping(DTW)arithmetictorealizespeechpatternmatching.Itisprovedthatthisarticledesignsasmallvocabulary,isolatedwordspeechrecognitionsystem,arithmeticofSpeechrecognizesimulatewit

4、hMATLABsoftware,theresultsshowthatthemodifiedalgorithmcanprovideabetterperformanceinthespeechrecognitionrate.Keywords:speechrecognitionsystem;endpointdetection;MFCC;DTW50引言______________________作者简介:陈若珠(1963-),女,1984年毕业于西安交通大学,现为兰州理工大学高级工程师,主要研究方向语音识别、嵌入式。胡金平

5、(1985-),男,江苏徐州人,兰州理工大学研究生,主要从事语音识别、嵌入式研究。在孤立词语音识别中,最为简单有效的方法是采用动态时间规整(DynamicTimeWarping,DTW)算法,该算法基于动态规划(DP)的思想,解决了发音长短不一的模板匹配问题,是语音识别中出现较早、较为经典的一种算法。DTW是把时间规整和距离测度计算结合起来的一种非线性规整技术,算法较为简洁,正确率也较高,在语音识别系统中有较广泛的应用。本文通过对端点检测算法和DTW改进算法的研究,对提高系统的识别率有很强的实用价值[1]。1语音

6、识别系统与DTW算法原理本质上讲,语音识别是一个语音信号模式识别问题[2],它由训练和识别两个过程完成。训练过程是从某一说话人大量语音信号中提取出该说话人的语音特征,并形成参考模式;识别过程是从待识语音中提取特征形成待识模式,与参考模式进行模式匹配,比较和判决,从而得出识别结果。本系统的结构如图1所示:5图1语音处理平台的系统图假设测试和参考模板分别用T和R表示,它们之间的相似度用它们之间的距离D[T,R]来度量,距离越小相似度越高[3]。为了计算这一失真距离,要从T和R中各个对应帧之间的距离算起。设n和m分别是

7、T和R中任意选择的帧号,d[T(n),R(m)]表示这两帧特征矢量之间的距离。在DTW算法中通常采用欧式距离。图2DTW算法搜索路径如图2所示,横轴上标出的是测试模板T的各个帧号n=1~N,纵轴上是参考模板R的各个帧号m=1~M,N不等于M。网格中的每一个交叉点(n,m)表示测试模式中某一帧与训练模式中某一帧的交汇点。DP算法就是寻找一条通过此网格中若干个格点的路径。路径不是随意选择的,首先任何一种语音的发音快慢都有可能变化,但是其各部分的先后次序不可能改变,因此所选的路径必定是从左下角出发,在右上角结束。假设路

8、径通过的格点依次为(n1,m1),…,(ni,mi),…,(nN,mM),其中(n1,m1)=(1,1),(nN,mN)=(N,M)。路径可以用函数来描述,其中ni=i,i=1,2,...,N,Φ(1)=1,。为了使路径不至于过分倾斜,约束斜率在0.5~2的范围内。如果路径已通过了格点(ni−1,mi−1),那么下一个通过的格点(ni,mi)只可能是(ni−1+1,mi−

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。