欢迎来到天天文库
浏览记录
ID:36421285
大小:8.57 MB
页数:54页
时间:2019-05-10
《基于GMMUBMSVM的哈萨克语话者识别技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、厦门大学硕士学位论文基于GMM--UBM/SVM的哈萨克语话者识别技术研究姓名:张奔申请学位级别:硕士专业:软件工程指导教师:曾文华201204摘要当前对话者识别技术的研究已经成为一个比较热门的话题,而以哈萨克语作为研讨对象还处于起步阶段。随着社会的发展,电话和手机的普及,电话语音在日常生活中占有一定的地位,新疆作为一个多民族的地区,由于哈萨克语语音的特性,与汉语之间的语言差异很大,因此,研究哈萨克语说话人识别技术是新疆经济发展的一个紧迫任务。另外,它的研究还将促进其他相似语言体系的语音研究工作,如维吾尔语、柯尔克孜语以及阿拉伯语等。因此开发以哈萨克语作为
2、研讨对象的技术具有很大的应用价值和实际意义。本文结合哈萨克语的发音特点规律,为实现一个面向实际应用话者识别系统,主要做以下工作:(1)根据哈萨克语语音库的设计规范,建立了50人的哈萨克电话自由会话语音库。(2)针对在大样本情况下仅采用声道倒谱特征参数时的支持向量机(SvM)话者模型训练效率低,本文提出了一种结合统计特征参数的GMM-UBM(混合高斯模型一统一背景模型)话者模型,由目标说话人和背景说话人的混合高斯模型提取的话者统计模型训练建立SVM话者模型。有效的解决了SVM训练时的大样本问题。(3)研究讨论了语音信号中所携带的激励特征及其动态参数对话者识别
3、性能的影响,提出了一种以激励源信息作为辅助系统的主从系统策略,主系统采用GMM-UBM模型,辅助系统为SVM模型,进一步提高了系统的识别率。(4)在嵌入式Linux下利用Perl语言及C语言编写了以哈萨克语作为研讨对象的话者识别系统。(5)基于GMM_UBM/SⅧ的方法在50个目标人训练集时,在目标人测试数据在20秒左右时,该提案方法G删一UBM/SvM的识别精度达到94%。关键词:说话人识别;哈萨克语;GMM-UBM;SVMAbstractInrecentyears,thestudytothespeakerrecognitiontechnologyhas
4、becomeahottopicathomeandabroad,whilethespeakerrecognitionsystemofkazakhhasbeeninitial.W池thepopularityoftelephoneandmobilephone,telephonevoiceplaysanimportantroleindailylife,andtheuseoftelephonevoiceforspeakerrecognitionhasbeenconvenient,Therefore,ithasgreatvalueandpracticalsignifi
5、cancetobulidthespeakerrecognitionsystemofkazakh.Inthispaper,wecombinesthecharacteristicsandrulesofkazaidapronunciationtoachieveapracticalapplication-orientedspeakerrecognitionsystem,mainlytodothefollowingwork:(1)Accordingtothedesignrulerofkazakhspeechdatabase,weestablished50phonef
6、reeconversationspeechdatabaseofkazakh.(2)Forthecaseofusingonlychannelcepstrumparametersofsupportvectormachine(SVM)speakermodeltrainingandlowefficiencyinlargesamples,thispaperproposesacombinationofstatisticalparametersoftheGMM-UBMspeakermodel,theTargetspeakerandthebackgroundspeaker
7、'sGaussianmixturemodel(GMM)wereextracted,thenbuildstatisticalmodelsandtrainSVMspeakermodel.ItisveryeffectivetosolvetheproblemofthelargesamplefortheSVMtraining.(3)Weresearchedanddiscussedtheinflunessoftheincentivecharacteristicsandthedynamicparameterscarriedbythespeechsignaltohowto
8、recognitionperformance,introduced
此文档下载收益归作者所有