基于嵌入式平台的文本相关说话人确认算法的研究

基于嵌入式平台的文本相关说话人确认算法的研究

ID:36812146

大小:2.34 MB

页数:57页

时间:2019-05-15

基于嵌入式平台的文本相关说话人确认算法的研究_第1页
基于嵌入式平台的文本相关说话人确认算法的研究_第2页
基于嵌入式平台的文本相关说话人确认算法的研究_第3页
基于嵌入式平台的文本相关说话人确认算法的研究_第4页
基于嵌入式平台的文本相关说话人确认算法的研究_第5页
资源描述:

《基于嵌入式平台的文本相关说话人确认算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、重庆邮电人学硕十论文摘要摘要说话人识别技术以其方便、经济、易于被接受以及安全可靠等特点R益成为人们生活和工作中重要且普及的用户身份验证方式。但是,在嵌入式平台上使用常规的方法难以达到实时处理的要求。对于基于动态时间弯折(DynamicTimeWarping,DTW)算法的文本相关说话人识别系统来说,在普通PC机器上很容易达到实时的效果,但将其移植到嵌入式平台,如多普达掌上电脑P800(CPU主频为201MHz)时,训练和识别速度就会很慢,难以满足实时性要求。目前,国内外针对嵌入式文本相关的说话人识别实现的研究,鲜有与运算速度相关的。本文针对这一现状,为了使文本相关说话人识别系统在嵌入式平台上得

2、以实用,借鉴了语音识别中的非线性分段(Non-LinearPartition.NLP)思想,把语音按照内容划分为N段,分别对每段语音建立说话人模型。在对说话人识别主流的建模方式高斯混合模型(GaussianMixtureMode[。GMM)和通用背景模型-高斯混合模型(Universa[BackgroundMode[·GaussianMixtureMode[,GMM—UBM)的方法进行比较和分析后,根据训练数据较短的特点以及实际使用的特殊环境,最终采用单高斯模型作为说话人模型。单高斯模型简单的特点同时也决定着它不能够精确的刻画说话人的个性特征。因此,系统采用多遍训练进行模型融合,并针对文本相关

3、的说话人识别语料选择合适的分段准则。除此之外,系统还使用双模型距离判决手段提高系统性能。在同一个语料库上测试得到的实验结果表明:基于非线性分段算法的系统等错误率为1.21%,与基于DTW的基线系统相比,相对性能提高了57%,并且系统的训练时间降低到基线系统的23%,识别时间降低到50%,在实时性和实用性上均有着良好的效果。关键词:嵌入式平台,说话人识别,文本相关,非线性分段algorithmSOastomaketext—dependentspeakerrecognitionsystemsapplicableinembeddedplatforms.Thiscutsthefeaturesequen

4、ceintoseveralrelativelystablesegmentsandtrainsspeakermodelsonthesesegments.Afteranalyzingthetwomainstreamapproaches(GMMmodelingandGMM—UBMmodeling),thisutilizestheSingle.Gaussianmodelingmethodtotrainspeakermodelsinviewofshorttrainingdataandspecialcircumstancesinactualuse.Single.GaussianmodelingiSadou

5、ble—edgedsword.Althoughitissimple,itcannotcharacterizeaspeaker’Spersonalityaccurately.Therefore,multi—trainingisusedformodelfusion.andanappropriatesegmentationcriterioniSestablishedaccordingtothecorpusoftext-specificspeakerrecognition.Apartfromthesemethods,theperformanceisfurtherimprovedthroughtheju

6、dgementofdouble.modeldistances.Theexperimentalresultsonthesamespeechcorpusshowthat,basedontheNLPalgorithm,theproposedtext—dependentspeakerrecognitionsystem,withanequalerrorrate(EER)of1.21%.acquiresaperformancegainof57%comparedtothebaselinesystembasedontheDTWalgorithm.Inthemeantime,thetrainingtimeisr

7、educedto23%thatofthebaselinesystem,andrecognizingtime50%.Therefore,theproposedsystemachievesabetterpracticalresultintermsofreal-timeperformance.KeYwords:EmbeddedApplications,SpeakerVerification,TextDe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。