基于 SPWD 时频脊特征提取的汉语声调识别.pdf

ID：54017881

大小：1.07 MB

页数：5页

时间：2020-04-28

资源描述：

《基于 SPWD 时频脊特征提取的汉语声调识别.pdf》由会员上传分享，免费在线阅读，更多相关内容在应用文档-天天文库。

1、第３１卷第３期计算机应用与软件Ｖｏｌ３１Ｎｏ．３２０１４年３月ＣｏｍｐｕｔｅｒＡｐｐｌｉｃａｔｉｏｎｓａｎｄＳｏｆｔｗａｒｅＭａｒ．２０１４基于ＳＰＷＤ时频脊特征提取的汉语声调识别徐郑丹于凤芹（江南大学物联网工程学院江苏无锡２１４１２２）摘要针对语音信号的非平稳性，采用ＳＰＷＤ（ｓｍｏｏｔｈｅｄｐｓｅｕｄｏＷｉｇｎｅｒＶｉｌｌｅｄｉｓｔｒｉｂｕｔｉｏｎ）将韵母语音信号在时频面清晰地表现出来。不同声调语音的时频脊的变化特征不同。利用阈值和细化处理将ＳＰＷＤ时频矩阵转变成二值矩阵图像，利用Ｈｏｕｇｈ变换提取脊线；而第三声时频脊是曲线，将Ｈｏｕｇｈ变换求取

2、的线段用最小二乘法多项式进行拟合；在脊线段上等间距选取若干个点，将点集和其一阶差分作为时频脊特征，利用高斯混合模型进行识别分类。仿真实验结果表明，该方法很好地对声调进行了识别，平均识别率为８６．４８％，第二声识别率提高的幅度最大，提高了５．１８％；在不同的信噪比下，识别率最大可提高５．６２％。关键词声调识别平滑伪ＷｉｇｎｅｒＶｉｌｌｅ分布时频脊Ｈｏｕｇｈ变换最小二乘法多项式拟合中图分类号ＴＮ９１２．３ＴＰ３９１文献标识码ＡＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１０００３８６ｘ．２０１４．０３．０３８ＣＨＩＮＥＳＥＴＯＮＥＲＥＣＯＧＮＩＴＩＯＮＢＡＳＥ

3、ＤＯＮＳＰＷＤＴＩＭＥＦＲＥＱＵＥＮＣＹＲＩＤＧＥＦＥＡＴＵＲＥＥＸＴＲＡＣＴＩＯＮＸｕＺｈｅｎｇｄａｎＹｕＦｅｎｇｑｉｎ（ＳｃｈｏｏｌｏｆＩｎｔｅｒｎｅｔｏｆＴｈｉｎｇｓＥｎｇｉｎｅｅｒｉｎｇ，ＪｉａｎｇｎａｎＵｎｉｖｅｒｓｉｔｙ，Ｗｕｘｉ２１４１２２，Ｊｉａｎｇｓｕ，Ｃｈｉｎａ）ＡｂｓｔｒａｃｔＦｏｒｔｈｅｎｏｎｓｔａｂｉｌｉｔｙｏｆｓｐｅｅｃｈｓｉｇｎａｌｓ，ｗｅｕｓｅＳＰＷＤｔｏｃｌｅａｒｌｙｍａｎｉｆｅｓｔｔｈｅｖｏｗｅｌｓｐｅｅｃｈｓｉｇｎａｌｓｏｎｔｉｍｅｆｒｅｑｕｅｎｃｙｐｌａｎｅ．Ｔｈｅｖａｒｉａｔｉｏｎｆｅａｔｕｒｅｓｏｆｔｉｍ

4、ｅｆｒｅｑｕｅｎｃｙｒｉｄｇｅｓｄｉｆｆｅｒｆｒｏｍｄｉｆｆｅｒｅｎｔｓｐｅｅｃｈｔｏｎｅｓ．ＷｅｕｓｅｔｈｒｅｓｈｏｌｄａｎｄｒｅｆｉｎｅｄｐｒｏｃｅｓｓｉｎｇｔｏｃｏｎｖｅｒｔＳＰＷＤｔｉｍｅｆｒｅｑｕｅｎｃｙｍａｔｒｉｘｔｏａｂｉｎａｒｙｍａｔｒｉｘｉｍａｇｅ，ａｎｄｕｓｅＨｏｕｇｈｔｒａｎｓｆｏｒｍｔｏｅｘｔｒａｃｔｒｉｄｇｅｌｉｎｅｓ．Ｂｕｔｔｈｅｔｉｍｅｆｒｅｑｕｅｎｃｙｒｉｄｇｅｏｆｔｈｅｔｈｉｒｄｔｏｎｅｉｓｃｕｒｖｅ，ｔｈｅｌｉｎｅｓｅｇｍｅｎｔｏｂｔａｉｎｅｄｂｙＨｏｕｇｈｔｒａｎｓｆｏｒｍｉｓｆｉｔｔｅｄｗｉｔｈｔｈｅｍｅｔｈ

5、ｏｄｏｆｌｅａｓｔｓｑｕａｒｅｓｐｏｌｙｎｏｍｉａｌ；Ｗｅｓｅｌｅｃｔｓｏｍｅｐｏｉｎｔｓｅｑｕｉｄｉｓｔａｎｔｌｙｏｎｔｉｍｅｆｒｅｑｕｅｎｃｙｒｉｄｇｅｌｉｎｅ，ａｎｄｕｓｅｔｈｅｐｏｉｎｔｓｅｔａｎｄｉｔｓｆｉｒｓｔｄｉｆｆｅｒｅｎｃｅａｓｔｈｅｆｅａｔｕｒｅｏｆｔｈｅｔｉｍｅｆｒｅｑｕｅｎｃｙｒｉｄｇｅ，ｔｈｅｎｕｓｅＧａｕｓｓｉａｎｍｉｘｔｕｒｅｍｏｄｅｌ（ＧＭＭ）ｔｏｃｏｎｄｕｃｔｒｅｃｏｇｎｉｔｉｏｎａｎｄｃｌａｓｓｉｆｉｃａｔｉｏｎ．Ｓｉｍｕｌａｔｉｏｎｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｓｈｏｗｔｈａｔｔｈｉｓｍｅｔｈｏｄｉｓｖｅ

6、ｒｙｇｏｏｄｔｏｔｈｅｔｏｎｅｒｅｃｏｇｎｉｔｉｏｎａｎｄｉｔｓａｖｅｒａｇｅｒｅｃｏｇｎｉｔｉｏｎｒａｔｅｉｓ８６．４８％．Ｔｈｅｉｍｐｒｏｖｅｍｅｎｔｅｘｔｅｎｔｏｆｔｈｅｓｅｃｏｎｄｔｏｎｅ’ｓｒｅｃｏｇｎｉｔｉｏｎｒａｔｅｉｓｔｈｅｈｉｇｈｅｓｔ，ａｓｈｉｇｈａｓ５．１８％．ＡｎｄｉｎｄｉｆｆｅｒｅｎｔＳＮＲ，ｔｈｅｍａｘｉｍｕｍｉｍｐｒｏｖｅｍｅｎｔｏｆｒｅｃｏｇｎｉｔｉｏｎｒａｔｅｒｅａｃｈｅｓ５．６２％．ＫｅｙｗｏｒｄｓＴｏｎｅｒｅｃｏｇｎｉｔｉｏｎＳｍｏｏｔｈｉｎｇｐｓｅｕｄｏＷｉｇｎｅｒＶｉｌｌｅｄｉｓｔｒｉｂｕｔｉｏｎＴｉｍｅｆｒ

7、ｅｑｕｅｎｃｙｒｉｄｇｅＨｏｕｇｈｔｒａｎｓｆｏｒｍＰｏｌｙｎｏｍｉａｌｆｉｔｔｉｎｇｗｉｔｈＬｅａｓｔｓｑｕａｒｅｓｍｅｔｈｏｄ语音信号是非平稳信号，且声调的信息主要反映在浊音段，０引言平滑伪ＷｉｇｎｅｒＶｉｌｌｅ分布ＳＰＷＤ是分析非平稳信号的一种有力工具，具有很好的时频聚集性。本文采用ＳＰＷＤ的方法将韵母汉语普通话是一种带有声调的语言。汉语普通话中将声调语音信号在时频面清晰地表现出来。在时频图中时频脊线表示［７］分成了四类：一声、二声、三声和四声。声调在汉语普通话中承的是瞬时频率的变化过程，是信号能量最集中的区域。ＳＰ担着非常重要的构字辩意作用，

8、在语音识别中结合声调特征有ＷＤ时频脊线清晰、形象地表现了不同声调脊线随时间的变化

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 5



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于 SPWD 时频脊特征提取的汉语声调识别.pdf

基于 SPWD 时频脊特征提取的汉语声调识别.pdf

相关文章

相关标签