说话人识别ppt课件.ppt

说话人识别ppt课件.ppt

ID:58654469

大小:117.00 KB

页数:43页

时间:2020-10-05

说话人识别ppt课件.ppt_第1页
说话人识别ppt课件.ppt_第2页
说话人识别ppt课件.ppt_第3页
说话人识别ppt课件.ppt_第4页
说话人识别ppt课件.ppt_第5页
资源描述:

《说话人识别ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、王林海2003.7.17说话人识别说话人识别一.概述1.什么是说话人识别(SR)?2.SR的历史3.语音识别技术4.语音识别的困难与对策5 语音识别的应用6.语音识别的前景1.什么是SR?说话人识别(SpeakerRecognition,SR)技术是以话音对说话人进行区分,从而进行身份鉴别与认证的技术。2.SR的历史60年代,计算机的应用推动了语音识别的发展。70年代,语音识别领域取得了突破80年代,语音识别研究进一步走向深入进入90年代,随着多媒体时代的来临,迫切要求语音识别系统从实验室走向实用。我国语音识别研究工作一直紧跟国际水平,国家也很重视,并把大词汇量语音识

2、别的研究列入“863”计划,由中科院声学所、自动化所及北京大学等单位研究开发。3.语音识别技术语音识别系统的分类方式及依据根据对说话人说话方式的要求,可以分为孤立字(词)语音识别系统,连接字语音识别系统以及连续语音识别系统根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统。根据词汇量大小,可以分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音识别系统。不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统的实现过程如图1所示。特征提取模式匹配模型库识别结果语音输入图1语音识别的实现语音识别技术主要包括特征提取技术、模式匹配

3、准则及模型训练技术三个方面。此外,还涉及到语音识别单元的选取(1)语音识别单元的选取选择识别单元是语音识别研究的第一步。语音识别单元有单词(句)、音节和音素三种,具体选择哪一种,由具体的研究任务决定。(2)特征参数提取技术语音信号中含有丰富的信息,但如何从中提取出对语音识别有用的信息呢?特征提取就是完成这项工作,它对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。(3)模式匹配及模型训练技术模型训练是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数,而模式匹配则是根据一定准则,使未知模式与模型库中的某一个模型获得最

4、佳匹配语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术(DTW)、隐马尔可夫模型(HMM)和人工神经元网络(ANN)。3 语音识别的困难与对策目前,研究工作进展缓慢,主要表现在理论上一直没有突破。虽然各种新的修正方法不断涌现,但其普遍适用性都值得商榷。●语音识别系统的适应性差,●高噪声环境下语音识别进展困难●语言学、生理学、心理学方面的研究成果应用●我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等分面的认识还很不清楚●语音识别系统从实验室演示系统到商品的转化过程中还有许多具体问题需要解决如果要使语音识别系统性能有大的提高,就要综合应用语

5、言学、心理学、生理学以及信号处理等各门学科有关知识,只用其中一种是不行的4 语音识别的应用AT&T于1992年开发的VRCP系统AT&T800语音识别服务系统NTTANSER语音识别银行服务系统NorthenTelecom股票价格行情系统●collectcall——受话人付费电话,命令字col1ect●person-person-call——定人呼叫,命令字person●third-party-billing-call——第三方付费电话,命令字thirdnumber●operator-assistedcall——话务员协助呼叫,命令字operator●creditca

6、rdcall——信用卡呼叫,命令字callingcard6.语音识别的前景SR技术发展至今,尽管已经取得了不错的进展,要寻找更加优良的研究方法仍然有相当艰巨的路要走。二.语者识别的基本问题(1)如何选取能够唯一表征人的有效而可靠的参量,如何对它进行处理。(2)如何规定相似性的测度使相似性的计算既简单又可靠。(3)考虑到人的状况在不断变化,为使系统能够可靠工作,如何使它的参考量不断更新以适应使用者。语音分析身份声明模型产生模型存储特征提取距离测量识别判决三.表征说话人特点的基本特征这些特征应该具有如下特点:(1)能够有效地区分不同的说话人,但又能在同一说话人的语音发生变

7、化时相对保持稳定。(2)易于从语音信号中提取。(3)不易被模仿。四.说话人识别的几种方法1.模板匹配法模板匹配法的要点是:在训练过程中从每个说话人发出的训练语句中提取相应的特征矢量,这些特征矢量能充分描写各个说话人的行为。这些特征矢量称为各说话人的模板。它们可以从单词,数字串或句子中提取。在测试阶段,从说话人发出的语音信号中按同样的处理方法提取测试模板,并且与其相应的参考模板相比较。2.概率模型法利用子词单元构成的隐含马尔柯夫模型,构成了一个说话人确认系统,每个子词单元用一个从左至右的HMM描写,每个模型包含2到3个状态。提取特征矢量初试分段构造种子

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。