说话人识别算法的研究

ID：5311076

大小：247.11 KB

页数：4页

时间：2017-12-07

资源描述：

《说话人识别算法的研究》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、2010年9月西安邮电学院学报Sept．2010第15卷第5期JOURNALOFXI’ANUNIVERSITYOFP0s]ANDTELEGOMMUNICATIONSVo1．15No．5说话人识别算法的研究郭春霞(西安邮电学院通信与信息工程学院，陕西西安710121)摘要：针对说话人识别问题，基于概率神经网络PNN，实验比较MFCC，△MFCC+MFCC分别与PNN相结合时的识别率。仿真结果表明，在文本有关情况下，当说话人说话内容为0～9的发音时，z~IFCC+MF(℃优于MFCC，使用PNN算法的识别率能够满足说话人识别的实际要求。关键词：说话人识别；概率

2、神经网络；特征提取；Mel频率倒谱系数；差分MFCC中图分类号：TP301文献标识码：A文章编号：1007—3264(2010)05—0104—03实用中得到了较好的效果l3_。0引言1．1Mel倒谱参数(MFCC)Mel频率倒谱系数(MFCC)是在频谱上采用滤建立一个说话人识别系统分为两个阶段：训练波器组的方法计算出来的，将语音频率划分成一系阶段和识别阶段。在训练阶段，系统的每一个使用列三角形的滤波器序列，这组滤波器在频率的美尔者说出若干训练语料，系统根据这些训练语料，通过(Me1)坐标上是等带宽的。这是因为人类在对训练学习建立每个使用者的模板或模型参数

3、参考1000Hz以下的声音频率范围的感知遵循近似线性集。而在识别阶段，把从待识别说话人说出的语音关系；对1000Hz以上的声音频率范围的感知不遵信号中提取的特征参数，与在训练过程中得到的参循线性关系，而是遵循在对数频率坐标上的近似线考参量集或模型模板比较，并且根据一定相似性准性关系。则进行判定⋯。说话人辨识时，取与测试语音匹配1．2差分MFCC的提取距离最小的说话人模型所对应的说话人作为说话人二次特征提取l4]是对原始特征向量序列进行辨识的结果，说话人确认时，用测试语音与所声称的再分析。通过对特征向量运用加权、差分、筛选等方说话人模型进行匹配，若匹配距离小

4、于规定的阀值，法，进一步剥离出隐藏在语音背后的说话人特征。则该说话人得到证实，否则该说话人不是他所声称二次特征提取其第一步是提取原始特征向量：的说话人[2】。MFCC或LPCC特征，随之是特征加权、特征差分、特征筛选等。1特征提取标准的MFCC只反映了语音参数的静态特性，而人耳对语音的动态特性更为敏感。为更好地拟合说话人识别技术的关键问题之一是提取反映说人发声和人耳听觉的动态特性，采用MFCC的一阶话人个性的语音特征参数。目前常用的特征参数包差分(AMFCC)Feature括线性预测倒谱系数(LPCC)、美尔倒谱系数～D(j)：Feature(j)—Fea

5、ture(j一1)(MF()等。LPCC参数和MFCC参数分别根据人(1)的发声原理和听觉感知原理，从人的声音提取出能其中，i=0，1，⋯P，J=1，2，⋯，N，P为特征阶数，量分布谱，从中获得声纹的独特特征，这两种参数在N为特征向量数。Feature为原有特征向量序列，收稿日期：2010—03—03作者简介：郭春霞(1977一)，女，河南沁阳人，西安邮电学院通信与信息工程学院助教。第5期郭春霞：说话人识别算法的研究·105·Feature-D为原有特征向量序列的一阶差分结果。(1)训练容易，收敛速度快，从而非常适用于实增加delta系数，即通过对静态参数

6、增加时间差，可时处理以提高说话人识别系统的性能。Delta系数可以通(2)可以完成任意的非线性变换，所形成的判决过下面的公式计算曲面与贝叶斯最优准则下的曲面相接近旦∑臼((3)具有很强的容错性+口一一)(4)模式层的传递函数可以选用各种用来估计D，=L——一(2)概率密度的核函数，并且分类结果对核函数的形式2：1不敏感D，可以通过相应的静态系数C+口和c日计算。公式(5)各层神经元的数目比较固定，因而易于硬件(2)依赖于过去和将来的语音值，可以通过使用下实现面的公式修改开始和结尾的语音PNN已较广泛地应用于非线性滤波、模式分D￡=Ct+1一C￡t<@和类、

7、联想记忆和概率密度估计当中，特别是在模式分D￡Cf—Ct+lt≥T一@类应用中PNN表现出了良好性能[，。综上所述，在提取了MFCC参数后，可用式(3)实验基于PNN的说话人识别系统实验采用多的差分特征参数提取算法提取~MFCC。输出型方式，对于20个人，只有一个人工神经网络Ct+1一C，t<@模型，而这个网络有多个输出节点，每一个输出节点—+1t≥T一@对应一个类别。在训练阶段，如果用于训练的输入0训练样本的类别标号是i，则训练时设第i个节点的∑口(+口一Ct一)(3)期望输出设为1，而其余输出节点期望输出均为0。三——————————————一其他@在

8、识别阶段，当一个未知类别的样本作用到输入端2∑时，考查各输出节点的

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 / 4



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

说话人识别算法的研究

说话人识别算法的研究

相关文章

相关标签