说话人识别与语种辨识课件.ppt

说话人识别与语种辨识课件.ppt

ID:57177595

大小:5.23 MB

页数:32页

时间:2020-08-02

说话人识别与语种辨识课件.ppt_第1页
说话人识别与语种辨识课件.ppt_第2页
说话人识别与语种辨识课件.ppt_第3页
说话人识别与语种辨识课件.ppt_第4页
说话人识别与语种辨识课件.ppt_第5页
资源描述:

《说话人识别与语种辨识课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、10.1概述10.2说话人识别方法和系统结构10.3应用DTW的说话人确认系统10.4应用VQ的说话人识别系统10.5应用HMM的说话人识别系统10.6应用GMM的说话人识别系统10.7说话人识别中尚需进一步探索的研究课题10.8语种辨别的原理和应第十章说话人识别和语种辨别10.1概述自动说话人识别(AutomaticSpeakerRecognition简称ASR)是一种自动识别说话人的过程。说话人识别和语音识别的区别在于,它不注重包含在语音信号内的文字符号以及语意内容信息,而是着眼于包含在语音信号中的个人特征,提取说话人的这些个人信息特征,以达到识别说别说话人的目的

2、。按其最终完成的任务可以分为两类:*自动说话人确认(简称ASV):确认一个人的身份,只涉及一个特定的参考模型和待识别模式之间的比较,只做“是”和“不是”的判决。*自动说话人辨认(简称ASI):必须辨认出待识别的语音是来自待考察认中的哪一个,有时还要对这个人以外的语音做出拒绝的判决。10.2说话人识别方法和系统结构说话人识别就是从说话人的一段语音中提取出说话人的个性特征,通过对这些个人特征的分析和识别,从而达到对说话人进行辨认或者确认的目的。图10-1是说话人识别系统的结构框图,它由预处理、特征提取、模式匹配和判决等几大部分组成。10.2.1预处理包括对输入计算机的语音

3、数据进行端点检测、预加重、加窗、分针等。10.2.2说话人识别特征的选取在说话人识别系统中特征提取是最重要的一环,特征提取就是从说话人的语音信号中提取出表示说话人个性的基本特征。在理想情况下,选取的特征应当满足下述准则:能够有效地区分不同的说话人,但又能在同一说话人的语音发生变化时相对保持稳定。易于从语音信号中提取不易被模仿尽量不随时间和空间变化如果把说话人识别中常用的参数加以简要归类,可划分为以下几类:线性预测参数及其派生参数语音频谱直接导出的参数混合参数其他鲁棒性参数上表是日本人Matui和Furui在1990年针对倒谱特征和基音特征所作的比较实验结果所用特征误识

4、率/(%)倒谱差值倒谱基音差值基音倒谱与差值倒谱倒谱、差值倒谱与基音、差值基音9.4311.8174.4285.887.932.8910.2.3特征参量评估方法在给定一种识别方法后,识别的效果主要取决于特征参数的选取。对于某一维单个的参数而言,可以用F来表征他在说话人识别中的有效性。可以选取两种分布的方差之比(F比)作为有效性准则。10.2.4模式匹配方法概率统计方法动态时间规整方法(DWT)矢量量化方法(VQ)隐马尔科夫模型方法(HMM)人工神经网络方法(ANN)10.2.5说话人识别中判别方法和阈值的选择10.2.6说话人识别系统的评价一个说话人识别系统的好坏是由

5、许多因素决定的。其中主要有正确识别率(或出错率)、训练时间的长短、识别时间、对参考参量存储量的要求、使用者适用的方便程度等,实用中还有价格因素。图10.3表示了说话人辨别与说话人确认系统性能与用户数的关系。10.3应用DWT的说话人确认系统一个应用DWT说话人识别系统如图10-4所示。它采用的识别特征是BPFG(附听觉特征处理),匹配时采用DWT技术。10.4应用VQ的说话人识别系统目前自动说话人识别的方法主要是基于参数模型的HMM的方法和基于非参数模型的VQ的方法。应用VQ的说话人识别系统如图10-5所示。应用VQ的说话人识别过程的步骤如下:训练过程从训练语音提取特

6、征矢量,得到特征矢量集;通过LBG算法生成码本;重复训练修正优化码本;存储码本识别过程从测试语音提取特征矢量序列由每个模板依次对特征矢量序列进行矢量量化,计算各自的平均量化误差:式中是第i个码本中第l个码本矢量,而是待测矢量和码矢量之间的距离选择平均量化误差最小的码本所对应的说话人作为系统的识别结果。10.5应用HMM的说话人识别系统10.5.1基于HMM的与文本有关的说话人识别基于HMM的与文本有关的说话人识别系统的结构如图10-6所示。10.5.2基于HMM的与文本无关的说话人识别10.5.3基于HMM的指定文本型说话人识别指定文本型说话人识别系统的基本构造如图1

7、0-7所示。10.5.4说话人识别HMM的学习方法10.5.5鲁棒的HMM说话人识别技术10.6应用GMM的说话人识别系统混合高斯分布模型是只有一个状态的模型,在这个状态里具有多个高斯分布函数10.6.1GMM模型的基本概念高斯混合模型(GMM)可以看做一种状态数为1的连续分布隐马尔科夫模型CDHMM。一个M阶混合高斯模型的概率密度函数是由M个高斯概率密度函数加权求和得到,所示如下:其中是一个D维随即向量,是子分布,,是混合权重。每个子分布是D维的联合高斯概率分布,可表示为:其中是均值向量,是协方差矩阵,混合权重值满足以下条件:完整的混合高斯模型由参

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。