基于正弦模型的语音识别时频特征.pdf

基于正弦模型的语音识别时频特征.pdf

ID:54367427

大小:242.47 KB

页数:5页

时间:2020-04-29

基于正弦模型的语音识别时频特征.pdf_第1页
基于正弦模型的语音识别时频特征.pdf_第2页
基于正弦模型的语音识别时频特征.pdf_第3页
基于正弦模型的语音识别时频特征.pdf_第4页
基于正弦模型的语音识别时频特征.pdf_第5页
资源描述:

《基于正弦模型的语音识别时频特征.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第S卷第1期解放军理工大学学报自然科学版Vol.SNo.12004年2月JournalofPLAUniversityofScienceandTechnologyFeb.2004文章编号1009-3443200401-0022-04基于正弦模型的语音识别时频特征邢艳玲杨吉斌张雄伟解放军理工大学通信工程学院江苏南京210007摘要为改善语音识别系统的性能采用时频分布参数来描述语音特征由于时频分布参数考虑到语音信号内在的非平稳特性因此能够更准确地描述语音信号的时频特性对基于正弦模型的多种时频参数能量谱和幅度加权瞬时频谱进行了比较并在基于

2、隐马尔可夫模型的连接词语音识别系统中进行了实验仿真结果表明单独采用时频分布参数作为ASR的前端特征并不能改善识别率而采用标准ASR特征和能量谱时频特征的联合前端特征可以有效地改善语音识别系统的识别效果关键词语音识别语音前端特征时频分布正弦模型能量谱中图分类号TN919.81文献标识码Aie-reuenceaturesorSpeechRecognitionBasedonSinusoidalSpeechModelX1NGYan-zngYANGJz-bznZHANGXzong-wezInstituteofCommunicationsen

3、gineeringPLAUniv.ofSci.STech.Nanjing210007ChinaAbstractTheuseoftime-freguencydistributionasfeaturesforautomaticspeechrecognitionASRisin-tendedtoimprovetheperformanceofASR.Becauseoftheinherentnon-stationarycharacteristicofspeechsignaltime-freguencydistributioncandescri

4、bethesignalmoreprecisely.Time-freguencyfeaturessuchasenergyspectrumandamplitudeWeightedshort-timeaverageoftheinstantaneousfreguencyarecom-paredbasedonthesinusoidalspeechmodelandsomeexperimentsarecarriedoutinconnecteddigitsrecognitionsystembasedon~iddenMarkovModels.The

5、resultsindicatethattime-freguencyfeaturesasfront-endcantimprovetheperformanceofASRsolelyWhilethefeatureWhichcombinesstandardASRfeaturesandtime-freguencyfeaturesbasedonenergyspectrumcanimprovetheperformanceofASRsys-temeffectively.KeWordsautomaticspeechrecognitionfront-

6、endfeaturestime-freguencydistributionsinusoidalspeechmodelenergyspectrum语音识别系统中常用的前端参数有LPCC一种线性的时频表示并不能准确地表示非平稳信LinearPredictionCepstralCoefficients~MFCC号的能量分布而语音信号属于非平稳信号具有丰MelFreguencyCepstralCoefficients等它们都是富的时频局域特征因此基于短时傅里叶变换的语语音信号在短时傅里叶Fourier变换基础上得到音前端特征并不能充分地刻

7、画语音信号的非平稳特的傅里叶分析是一种全局变换无法同时表述信号性为提高语音识别的性能本文尝试了利用二次型的时频局域特征在此基础上的短时傅里叶变换是时频分布参数作为语音前端特征的识别效果实验结果表明在原有MFCC参数的基础上增加时频分收稿日期2003-04-18.布特征可以有效地改善识别系统的性能作者简介邢艳玲1978-女硕士生.第1期邢艳玲,等,基于正弦模型的语音识别时频特征Z3cy)表示,通常采用如图1所示的通用滤波器组结构实现4]1时-频分析原理G傅里叶变换是信号分析和处理中最常用的工具,它通过把任意波形分解成许多不同频率正弦

8、波的叠加,来实现信号时域和频域间的互相转化1]G然而傅里叶变换是一种全局变换,它只能分别从时域和频域上分析信号,而不能把二者有机地结合起来G由于傅里叶变换局部化分析性能的缺陷,使得它对图1基于通用滤波器组的ASR前端特征非平稳信号的分析能力较弱G而

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。