说话人分割聚类中的建模方法研究

说话人分割聚类中的建模方法研究

ID:35097703

大小:6.87 MB

页数:83页

时间:2019-03-17

说话人分割聚类中的建模方法研究_第1页
说话人分割聚类中的建模方法研究_第2页
说话人分割聚类中的建模方法研究_第3页
说话人分割聚类中的建模方法研究_第4页
说话人分割聚类中的建模方法研究_第5页
资源描述:

《说话人分割聚类中的建模方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、夺固钟達省若大赛UniversitofScienceandTechnoloofChinaygy硕±学位论文?...t,^‘-’扣心快‘乃I"■'—'?■::;.:‘';-?-一■--兴',??—4.?论说巧人分刹聚类中的文题目走換方法研完作者姓名±A信息与遺信工程学科专业奔武到教投来方到教梭胃!)巾二〇—六年五月完成时间、木固#《省来大赛硕±学位论文參说话人分割聚类中的建模方法研究作者姓名:许燕

2、学科专业:信息与通信王释导师姓名:郭武副教授K宋彦副教授二〇—完成时间:六年五月一kNUniversitofScienceandTechnolofChinaygyoA'dissertationformastersdereeg參TheModelinResearchingSeakerDiarizationpAuthor:anXuYSecialit:InfonnationandCommunicationEnineerinpygg

3、Supervisor:AssociateProf.WuGuoAssociateProf.YanSongFinishedTime:Ma2016y,Ik■I中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人巧导师指导下进行研究工作所取得的成果。除己特别加W标注和致谢的地方外,论文中不包含任何他人己经发表或撰写过的研究成果一。与我同工作的同志对本研究所做的贡献均己在论文中作了明确的说明。與、如作者签名:汗签字H期:中国科学技术大学学位论文授权使用声明

4、一作为申请学位的条件之,学位论文著作权拥有者授化中闽科学巧术大学,拥有学位论文的部分使用权即:学校有权按有关规定向国家有关部n或机构送交论文的复印件和电子版,可W将学位论文编入《中国,允许论文被查阅和借尚学位论文全文数据库》等有关数据库进行检索,可W采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。回公开□保密年Ns作者签名:钟癖、导师签名:l(V<Ki|<.占M签字日期:而(;签字H期;>摘耍

5、摘要,随着置联网时代的到来W及大数据的发展,每天接受的信息大幅増长,这些信息中包含着电巧通信、电视和网络等语音信息,巧时随着科技的不断发展和电子设备的大量普及,有声邮件、语音搜索等在日常生巧中扮演着越来越重要的角色。面对这些如雨后春資般出现的信息,如何从中有效提取有用的信息,是目前研究的难点和热点。说话人分割聚类融合丫多种音频处理技术,并能够实现对说话人类别和说话内容的精确管理,因此说话人分割聚类技术引起了众多学者的兴趣,比如麻省一理工,、法国LIMSI、剑桥、伯克利等己经展开研究且取得了定成果,

6、但是说话人分割聚类中仍有几大难点难W解决,比如复杂场景下建模不准确、短时语音段表示不准确、聚类效率巧W及说话人数目确定困难等,本文针对这些问题展开研究,具体内容为W下化个方面:针对复杂场愚下建模不准确的问题,论文将有监督的建模方法应用到说话人分割聚类中,利用深度神经网络替代传统建模方法提取语音信号中深层次的,复杂信息,将输出节点中的音素状态作为建模初始类别数并和全差异建模相结合,从而使音素特征和说话人特征有效地解稱,最终得到对语音段更加鲁棒性的表示,从而提高系统性能。对于短时语音段表示不准确的问

7、题,论文提出了构造基于深度神经网络的说话人类内短时语音段差异建模的方法,通过对存在差异的短时语音段进行有,效建模,补偿语音段之间的義异,减少干扰信息的负面影响从而使得低维因子向量准确的包含语音段中的说巧人信息,从而使得短时语音段能够更加准确地被表示。,为了能够实现高效建模的目标提商聚类效率,论文用谱聚类的方法代替原,通过计算语音段间的距离有的层次凝聚聚类,构造基于距离的关联矩阵,利用改进的Eena语音段中的说话人数目,iggp方法寻找最优的聚类数目,确定根据己经确定的类别数,通过对关联矩阵特征结构分

8、布的分析,对分割后的语音段进行聚类。谱聚类的方法不仅解决了说话人数目难W确定的问题,而且聚类速度商于传统的层次凝聚聚类方法。利用本文提出的S种方法,能够有效解决目前说话人分割聚类中存在的难。点,,通过实验结果可W表明系统性能有大

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。