基于SPWD时频脊特征提取的汉语声调识别-论文.pdf

基于SPWD时频脊特征提取的汉语声调识别-论文.pdf

ID:53761808

大小:914.96 KB

页数:4页

时间:2020-04-24

基于SPWD时频脊特征提取的汉语声调识别-论文.pdf_第1页
基于SPWD时频脊特征提取的汉语声调识别-论文.pdf_第2页
基于SPWD时频脊特征提取的汉语声调识别-论文.pdf_第3页
基于SPWD时频脊特征提取的汉语声调识别-论文.pdf_第4页
资源描述:

《基于SPWD时频脊特征提取的汉语声调识别-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第31卷第3期计算机应用与软件V01.31No.32014年3月ComputerApplicationsandSoftwareMar.2014基于SPWD时频脊特征提取的汉语声调识别徐郑丹于凤芹(江南大学物联网工程学院江苏无锡214122)摘要针对语音信号的非平稳性,采用SPWD(smoothedpseudoWigner.Villedistribution)将韵母语音信号在时频面清晰地表现出来。不同声调语音的时频脊的变化特征不同。利用阈值和细化处理将SPWD时频矩阵转变成二值矩阵图像,利用Hough变换提取脊线;而第

2、三声时频脊是曲线,将Hough变换求取的线段用最小二乘法多项式进行拟合;在脊线段上等间距选取若干个点,将点集和其一阶差分作为时频脊特征,利用高斯混合模型进行识别分类。仿真实验结果表明,该方法很好地对声调进行了识别,平均识别率为86.48%,第二声识别率提高的幅度最大,提高了5.18%;在不同的信噪比下,识别率最大可提高5.62%。关键词声调识别平滑伪Wigner—Ville分布时频脊Hough变换最小二乘法多项式拟合中图分类号TN912.3TP391文献标识码ADOI:10.3969/j.issn.1000-386x

3、.2014.03.038CHINESEToNERECoGNITIoNBASEDONSPWDTIME-FREQUENCYRII)GEFEATUREEXTRACTIoNXuZhengdanYuFengqin(SchoolofInternetofThingsEngineering,JiangnanUniversity,Wuxi214122,Jiangsu,China)AbstractForthenon-stabilityofspeechsignals,weuseSPWDtoclearlymanifestthevowelsp

4、eechsignalsontime·frequencyplane.Thevariationfeaturesoftime-frequencyridgesdifferfromdifferentspeechtones.WeusethresholdandrefinedprocessingtoconvertSPWDtime-~equencymatrixtoabinarymatriximage,anduseHoughtransformtoextractridgelines.Butthetime一~equencyridgeofth

5、ethirdtoneiscurve,thelinesegmentobtainedbyHoughtransformisfittedwiththemethodofleastsquarespolynomial;Weselectsomepointsequidistantlyontime—frequencyridgeline,andusethepointsetanditsfirstdifferenceasthefeatureofthetime一~equeneyridge,thenuseGaussianmixturemodel(

6、GMM)toconductrecognitionandclassification.Simulationexperimentalresultsshowthatthismethodisverygoodtothetonerecognitionanditsaveragerecognitionrateis86.48%.Theimprovementextentofthesecondtone’Srecognitionrateisthehighest,ashighas5.18%.AndindiferentSNR,themaximu

7、mimprovementofrecognitionratereaches5.62%.KeywordsTonerecognitionSmoothingpseudoWigner··VilledistributionTime-frequencyridgeHoughtransformPolynomialfittingwithLeastsquaresmethod语音信号是非平稳信号,且声调的信息主要反映在浊音段,0引言平滑伪Wigner-Ville分布SPWD是分析非平稳信号的一种有力工具,具有很好的时频聚集性。本文采用SPW

8、D的方法将韵母汉语普通话是一种带有声调的语言。汉语普通话中将声调语音信号在时频面清晰地表现出来。在时频图中时频脊线表示分成了四类:一声、二声、三声和四声。声调在汉语普通话中承的是瞬时频率的变化过程,是信号能量最集中的区域。SP—担着非常重要的构字辩意作用,在语音识别中结合声调特征有WD时频脊线清晰、形象地表现了不同声调脊线随时间的变化。助于提高

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。