说话人识别的系统设计

说话人识别的系统设计

ID:8350267

大小:1.41 MB

页数:75页

时间:2018-03-21

说话人识别的系统设计_第1页
说话人识别的系统设计_第2页
说话人识别的系统设计_第3页
说话人识别的系统设计_第4页
说话人识别的系统设计_第5页
资源描述:

《说话人识别的系统设计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、北京科技大学本科生毕业设计(论文)摘  要说话人识别技术是一种的重要生物认证手段,也是身份鉴别学术会议中的一项重要内容。说话人识别的目的是通过话语找出或核实说话人的身份,可以被用于访问控制。它属于语音信号领域的一个模式识别问题。本文使用交叠分帧的方法短时化语音信号,使用每帧信号的能频值区分语音信号和噪声信号。特征提取方面,本文使用线性预测倒谱系数和基音频率来表征生成语音的发音器官的差异(先天的),用差分线性预测倒谱系数和差分基音频率表征发音器官发音时动作的差异(后天的)。四种特征加权扩维得到的组合特征矢量最终表征了一个特定的说话人。分类决

2、策方面,本文使用矢量量化的方法完成对说话人语音信号的分类和判决。本文设计的系统是基于Java语言和SQLServer2000数据库实现的。Java语言用于实现语音样本采集、预处理、特征提取、分类决策等说话人识别所需的各种算法。SQLServer2000数据库用于存储已注册说话人的语音码本。关键词:说话人识别;基音;线性预测;矢量量化本文在实现系统的基础上,分析了组合特征中各分量对说话人识别的贡献大小。得到的结论是:用于说话人识别的参数中,线性预测倒谱系数效果最好,差分线性预测倒谱系数次之,基音频率再次之,差分基音频率效果最差。根据这一结论

3、,系统通过调整组合特征中各分量加权系数的方式突出贡献大的分量。实验表明,调整后系统识别率显著提高。对于10名男性语音的码本库,本文实现系统的识别率可达到87%。3--北京科技大学本科生毕业设计(论文)Theresearchofthetext-independentspeakerrecognitionsystemAbstractSpeakerrecognitiontechnologyisoneoftheimportantbiometricways,aswellasanimportantpartinacademicconferencesofi

4、dentification.Thepurposeofspeakerrecognitionisidentifyingorverifyingthespeaker'sidentitythroughthediscourse,whichcanbeusedtocontrolaccess.Itisapatternrecognitionproblemonspeechsignals.Thispaperusesthewayofoverlappingsub-frametoshortthevoicesignal,andusestheEnergyFrequency

5、Valueofeachframetoseparatethevoicesignalfromthenoisesignal.Intherespectoffeatureextraction,thispaperusesLPCCandpitchfrequencytocharacterizepronunciationorgansgeneratedvoicesounds(congenital),andusesdifferentialLPCCanddifferentialpitchfrequencycharacterizethedifferenceofpr

6、onunciationorganmovestopronounce(acquired).Ultimately,acomponentfeaturevector,whichisobtainedbyweightedandunitedthatfourfeatures,characterizeaparticularspeaker.Intherespectofclassificationanddecision,weusemethodofvectorquantizationtocompletetheclassificationandsentencingf

7、orspeakers'speechsignal.ThesystemthatisdesignedbythispaperisachievedbasedontheJavalanguageandSQLServer2000database.Javalanguageisusedtoimplementalgorithmsneededbyspeakerrecognition,suchasvoicesampling,preprocessing,featureextraction,classificationanddecisionandsoon.SQLSer

8、ver2000databaseisusedtostoreregisteredspeakers'voicecodebooks.KeyWords:speakerrecognition;pitch;

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。