应用动态时间规整与矢量量化的语音识别算法.pdf

应用动态时间规整与矢量量化的语音识别算法.pdf

ID:52410762

大小:294.08 KB

页数:5页

时间:2020-03-27

应用动态时间规整与矢量量化的语音识别算法.pdf_第1页
应用动态时间规整与矢量量化的语音识别算法.pdf_第2页
应用动态时间规整与矢量量化的语音识别算法.pdf_第3页
应用动态时间规整与矢量量化的语音识别算法.pdf_第4页
应用动态时间规整与矢量量化的语音识别算法.pdf_第5页
资源描述:

《应用动态时间规整与矢量量化的语音识别算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第32卷第3期2010年6月光学仪器OPTICALINSTRUMENTS坛疆32。No.3June,2010文章编号:1005—5630(2010)03一0041一05应用动态时问规整与矢量量化的语音识别算法*徐相华,徐伯庆(上海理工大学光电信息与计算机工程学院,上海200093)摘要:提出了一种基于动态时间规整(DTW)的改进乎均最小距离识别算法,改善了孤立词识别的鲁棒性并提高了识剐率。同时对矢量量化(VO)算法分析了不同码本大小下的识别率,并比较了各种算法的运算时间。通过在MatLab上实现特定人孤立词小词汇量语音识别,

2、实验的结果表明:基于DTW算法的改进平均最小距离法识别率显著提高;码本较大时VQ算法的识别率最高;VQ算法的识别率一般高于DTW算法且运行时间短。关键词:动态时间规整;矢量量化;倒谱系数;欧氏距离中图分类号:TN912.34文献标识码:Adoi:10.3969/j.issn.1005-5630.2010.03.010SpeechrecognitionalgorithmusingdynamictimewarpingandvectorquantizationxuXiangh铭口.XUBoqing(SchoolofOptical-

3、ElectricalandComputerEngineering,UniversityofShanghaiforScienceandTechnology,Shanglmi200093,China)Abstract:Animprovedmeanminimumdistancemethodbased011DTWisproposedinthispaper,itimprovestherobustnessofisolatedwordsrecognitionandincreasestherecognitionrate.Therecogni

4、tionrateofVQalgorithmindifferentcodebooksizeisalsoanalyzedaswellasthecomputingtimeofeachalgorithm.Byrealizationofspecific-personisolated-wordsmall—vocabularyspeechrecognitiononMatLab,theresearchshowsthattherateofimprovedmeanminimumdistancemethodbasedonDTWimprovesre

5、markablyandtherateofVQalgorithmisthehighestinlargecodebook.VQalgorithmisusuallyhigherthanDTWinrecognitionrateandtakeslesscomputingtime.Keywords:dynamictimewarping;vectorquantization;cepstrumcoefficient;Euclideandistance引言在语音识别系统中,算法的选择很大程度上决定了识别的性能。动态时间规整(dynamicti

6、mewarping,DTW)和矢量量化(vectorquantization,VO)是目前语音识别系统中广泛使用的两种技术。动态时间规整采用动态规划思想很好地解决了语音模式匹配过程中的时间对准难题。矢量量化技术通过对训练数据进行聚类,把大量的特征矢量用码字数较少的码本来表示,在尽可能保留特征矢量的有效信息的前提下,去掉多余或无用的信息,从而节约了存储空间,加快了运算速度。。收稿日期:2009一II一25作者简介:徐相华(1982一),男,江苏南通人。硕士研究生,主要从事信号信息处理方面的研究。·42·光学仪器第32卷文中介绍

7、了基于DTW的3种不同数据处理算法及VQ识别算法;分析了DTW算法和VQ算法的识别率并比较了它们的程序运行时间。1动态时间规整动态时间规整(DTW)是日本学者板仓(hakura)于60年代提出的一种算法。它将动态规划技术应用于解决孤立词识别时的说话速度不均匀的难题,是一种把时间规整和距离测度计算结合起来的一种非线性归整技术。1.1D'rw基本原理设参考模板的特征矢量序列为:z,,z:,⋯,‰,待测特征矢量序列为:Y·,yz,⋯,弘,m≠疗。动态时间规整算法就是要寻找一个最佳的时间规整函数(或路径),把待测语音的时间轴,z非线

8、性地映射到参考模板的时间轴m上,使得总的累计失真达到最小。实现过程可分两步来完成:第一步计算两个模板各特征矢量问的距离(欧氏距离),构成一个mXn阶距离矩阵;第二步在距离矩阵中用动态规划的思想,找出一条最佳路径,该路径起始于矩阵左下角(对应于两模板的起始帧)终止于矩阵右上角(对应于两模板的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。