普通话的语音情感识别技术

普通话的语音情感识别技术

ID:11649806

大小:33.50 KB

页数:15页

时间:2018-07-13

普通话的语音情感识别技术_第1页
普通话的语音情感识别技术_第2页
普通话的语音情感识别技术_第3页
普通话的语音情感识别技术_第4页
普通话的语音情感识别技术_第5页
资源描述:

《普通话的语音情感识别技术》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、精选公文范文管理资料普通话的语音情感识别技术[键入文字][键入文字][键入文字]精选公文范文管理资料普通话的语音情感识别技术[键入文字][键入文字][键入文字]精选公文范文管理资料普通话的语音情感识别技术[键入文字][键入文字][键入文字]精选公文范文管理资料普通话的语音情感识别技术[键入文字][键入文字][键入文字]精选公文范文管理资料普通话的语音情感识别技术[键入文字][键入文字][键入文字]精选公文范文管理资料普通话的语音情感识别技术[键入文字][键入文字][键入文字]精选公文范文管理资料  1引言  语音是人们交流的主要方式,语音信号不仅传递语义信息,而且通

2、过高低强弱、抑扬顿挫来表达说话人丰富的情感信息。当说话人愤怒时,音调升高、语速加快;悲伤时,语调低沉、语速缓慢。听者可以通过语音信号感受说话人的情感变化。如何使计算机从语音信号中自动识别出说话人的情感状态及其变化,是实现自然人机交互界面的关键前提,具有很大的研究价值和应用价值。例如:可以用于对电话服务中心用户紧急程度的分拣,从而提高服务质量;用于对汽车驾驶者的精神状态进行监控,从而在驾驶员疲劳时进行提醒,避免交通事故的发生;用于对抑郁症患者的情感变化进行跟踪,从而作为疾病诊断和治疗的依据等。计算机的语音情感识别能力是计算机情感智能的重要组成部分。目前,国内外学者在这

3、方面进行了大量的研究。  对语音情感相关特征的有效提取是该领域内十分重要的研究课题。由于语音情感本身自有的复杂性,还没有占据重要地位的有效情感特征被提出[1].寻找合适的情感识别算法,也是本领域研究者一直以来努力的目标。  Origlia等人[2]使用基频和能量相关特征的最大值、最小值、均值、标准差组成了一个31维的韵律特征集,在一个包含有意大利语、法语、英语、德语在内的多语种情感语料库上取得了接近60%的识别率。  Seppnen等人[3]使用基频、能量、时长相关的43维全局韵律特征进行芬兰语的情感识别,在说话人不相关的情形下取得了60%的识别率。  Li等人[

4、4]提取了频率微扰和振幅微扰并将其作为声音质量参数对SU-SAS数据库中的语料数据进行了说话人不相关的情感识别,HMM(HiddenMarkovModel)被用作识别器,同仅使用Mel频率倒谱系数(Mel-FrequencyCepstral[键入文字][键入文字][键入文字]精选公文范文管理资料Coefficients,MFCC)的基线性能65.5%的识别率相比,MFCC和频率微扰的特征组合可以得到68.1%的识别率,MFCC和振幅微扰的特征组合可以得到68.5%的识别率,最佳性能69.1%的识别率由MFCC、频率微扰和振幅微扰的共同组合获得。  Nwe等人[5]将

5、HMM用作分类器对包括生气、厌恶、害怕、高兴、悲伤和惊讶在内的6类情感进行说话者相关的识别,结果表明LF-PC取得了77.1%的识别率。  Breazeal等人[6]利用高斯混合模型(GaussianMixtureModel,GMM)分类器对面向婴儿的KISMET数据库进行情感分类,并使用一种基于峰态模型的选择策略对Gaussian成分的数量进行优化,由基频和能量的相关特征训练得到GMM模型,最优性能可达到78.77%.  Nichoson等人[7]基于MLP(multi-layer[键入文字][键入文字][键入文字]精选公文范文管理资料perceptron)建立了

6、一个OCON网络模型,对8种情感进行识别,所使用的数据库是自行录制的,有100位说话者参与录制。实验表明,该模型的最优识别率为52.87%.上述研究大多数都是针对西方语种的语音情感。而针对普通话语音情感的研究则较少,基本都是在国内进行,主要研究机构有东南大学、微软亚洲研究院、清华大学、浙江大学及台湾的一些大学和研究所等。由于普通话与西方语种发音的方式不同,普通话是声调语言,而英语等西方语种是重音语言,因此能准确表达情感的特征必然不尽相同。  针对普通话的语音情感,本文在普通话情感语料库上提取了一些与其它研究不同的语音情感特征参数组合,接着对原始特征集合利用主成分分析

7、(PrincipalComponentAnaly-sis,PCA)来降低维数,然后采用多类分离支持向量机(Sup-portVector[键入文字][键入文字][键入文字]精选公文范文管理资料Machine,SVM)进行建模,最后进行大量识别测试实验。  2语音情感识别系统结构  本文的语音情感识别系统结构如图1所示,每个步骤之间通过样本数据进行关联。情感特征的提取、PCA降维和SVM建模是其中的关键环节。    3语音情感特征的提取  情感语音库能为情感建模和情感语音声学特征分析提供统计数据支持,同时也为情感语音识别提供必要的训练和测试语料数据。情感语音库的质量

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。