基于MFCC和LPCC的说话人识别

基于MFCC和LPCC的说话人识别

ID:38136959

大小:413.35 KB

页数:3页

时间:2019-06-01

基于MFCC和LPCC的说话人识别_第1页
基于MFCC和LPCC的说话人识别_第2页
基于MFCC和LPCC的说话人识别_第3页
资源描述:

《基于MFCC和LPCC的说话人识别》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、余建潮,张瑞林:基于MFCC计和算L机PC工C的程说与话设人计识别ComputerEngineeringandDesign2009,30(5)1189人工智能基于MFCC和LPCC的说话人识别余建潮,张瑞林(浙江理工大学,浙江杭州310018)摘要:MFCC参数和LPCC参数是说话人识别中两种最常用的特征参数,研究了MFCC和LPCC参数提取的算法原理及差分倒谱参数的提取方法,采用MFCC、LPCC及其一阶、二阶差分作为特征参数,通过k均值算法与三层BP神经网络来进行说话人识别。实验结果表明,该方法可以有效提高识别率,同时

2、也验证MFCC参数的鲁棒性优于LPCC参数。关键词:LPCC;MFCC;特征提取;说话人识别;神经网络;K均值算法中图法分类号:TP391.42文献标识码:A文章编号:1000-7024(2009)05-1189-03SpeakerrecognitionmethodusingMFCCandLPCCfeaturesYUJian-chao,ZHANGRui-lin(ZhejiangScienceTechnologyUniversity,Hangzhou310018,China)Abstract:MFCCandLPCCareth

3、etwomostimportantfeatureparametersinspeakerrecognition.OnthealgorithmprincipleofMFCCandLPCCparameterextractionandtheextractionmethodofcoefficientcepstralparameterareresearched.TheSpeakerrecognitionisrealizedbyK-meansalgorithmandthree-layerneutralnetwork,adoptingMF

4、CC,LPCCandacceleratedcoefficientasfeatureparameter.Theresultshownthatthismethodcanefficientlyacceleratetherecognitioncapacityofthesystem,meanwhile,itprovesthattherobustnessofMFCCparameterispriortothatofLPCCparameter.Keywords:linearpredictioncepstrumcoefficient;mel

5、frequencycepstralcoefficients;featureextraction;speakerrecognition;neutralnetwork;K-means10引言=(1)1说话人识别是指通过对说话人语音信号的分析处理,提=1<设其冲激响应为,此处要计算的就是其倒谱。根取相应的特征或建立相应的模型,用来确认说话人的身份。据倒谱的定义,有目前,在说话人识别中最常用的特征参数是基于声道的LPCC<<(linearpredictioncepstrumcoefficient)和基于听觉特性的MFCClg==(

6、2)=1(melfrequencycepstralcoefficients)参数[1]。说话人识别的方法将式(1)代入式(2),并将其两边关于z求导,即有可以分为3类:模版匹配法、概率模型法、人工神经网络法。+1在说话人识别中,最终要做出的分类数目往往不大,而神经网<=1=+1(3)络已被证实了对类别数目小但分类困难的模式识别问题有很=11[2]好的效果,实验将提取LPCC参数和MFCC参数并通过三层=1因而有BP神经网络建立说话人识别系统来验证两种参数的鲁棒性<和优劣性。(1)+1=+1(4)=1=1=1[3]令其左右两

7、边的常数项和1各次幂的系数分别相等,即1特征参数的提取<<得到和之间的递推关系,从而由求出在提取特征参数之前,所采集的信号必须经过预处理,一<0=00般包括预加重、加窗、分帧,为减少计算量提高计算精度,在预<1=1处理后进行端点检测即利用短时平均能量和过零率的双门限<1<判决法得到有效语音段的起始端点和结束端点的帧数。=+1/1(5)=11.1LPCC参数的提取{<<通过线性预测(LPC)分析得到的声道模型的系统函数[4]为=1/>=1收稿日期:2008-03-21E-mail:yujianchao2005@126.com

8、基金项目:浙江省自然科学基金项目(Y106148)。作者简介:余建潮(1982-),男,浙江温州人,硕士研究生,研究方向为语音识别、说话人识别;张瑞林(1961-),男,浙江嵊州人,博士,教授。11902009,30(5)计算机工程与设计ComputerEngineeringandDesign<<按式(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。