基于贝叶斯方法的鲁棒语音切分

基于贝叶斯方法的鲁棒语音切分

ID:5334558

大小:294.19 KB

页数:5页

时间:2017-12-08

基于贝叶斯方法的鲁棒语音切分_第1页
基于贝叶斯方法的鲁棒语音切分_第2页
基于贝叶斯方法的鲁棒语音切分_第3页
基于贝叶斯方法的鲁棒语音切分_第4页
基于贝叶斯方法的鲁棒语音切分_第5页
资源描述:

《基于贝叶斯方法的鲁棒语音切分》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第17卷第3期数据采集与处理Vol.17No.32002年9月JournalofDataAcquisition&ProcessingSep.2002文章编号:100429037(2002)0320260205基于贝叶斯方法的鲁棒语音切分张文军谢剑英李聪(上海交通大学自动化系上海,200030)摘要在基于隐马尔科夫模型的语音切分基础上,融合了不受噪声干扰的先验切分模型,提出了基于贝叶斯方法的语音切分方法。在贝叶斯切分方法的框架内,作者首先对语音序列进行了变换,将由切分点构成的序列变为由音节长度构成的序列。然后,假设音节长度序列符合一阶马尔科夫过程,经过归一化处理后,求出了切分的先验概率公式

2、,得到了贝叶斯方法的切分模型。在噪声环境下的实验证明,由于切分模型独立于噪声,对在噪声环境下声学模型的失配提供了很好的补偿,使得语音切分的鲁棒性大大增加。关键词:鲁棒性;语音切分;贝叶斯;切分模型中图分类号:TN911文献标识码:ABayesianApproachtoRobustSpeechSegmentationZhangWenjunXieJianyingLiCong(DepartmentofAutomation,ShanghaiJiaotongUniversityShanghai200030,P.R.China)AbstractAlargequantitiesofphonetical

3、lysegmentedspeechisnecessaryinspeechrecogni2tionandspeechsynthesis.BasedonHMMspeechsegmentation,thispaperpresentsaBayesianapproachtorobustspeechsegmentation.ByhiddenMarkovmodel,itcombinedwithapriorsegmentationmodelwhichisindependenttonoisefeatureasthecompensationforthemismatchofacousticmodeltoenh

4、ancetherobustperformance.ExperimentshowsthevalidityofBayesianspeechsegmentation.Keywords:robustness;speechsegmentation;Bayesian;segmentationmodel界位于哪一个时间点上。一些受限于语言信息的切[3~6]引言分方法被用于无噪声的语音切分。总体说来,与早期的切分方法相比较,基于隐马尔科夫的语音在语音识别和语音合成中,按音节切分的连续切分方法在语音边界时间标注的准确性上体现了语音库有着广泛的应用。语音切分方法可以分为两明显的优势,并提供了一个简洁的标注解

5、码过程。大类。(1)第一类适用于待切分的语音波形中所包在语音库的建立过程中,每一个语音段所对应的语含的音节序列未知的状况。这类语音切分算法往往言内容是已知的,可以获得语音段所含有的音节信在双语语音库中特别有用。这类算法并不准确地标息,因此一般采用第二类语音切分方法。注出音节间的边界,而是根据语音谱的瞬间变化标注出类似音节(伪音节)的语音段。一些研究工作考1语音切分的贝叶斯框架[1,2]虑了使用谱差异函数的切分方法。(2)第二类受语言信息限制,基于已知语音波形中所包含的音节[5]基于隐马尔科夫模型的切分标准是使在该序列的假设。例如对于一个语音串“7552371”,我们切分条件下,生成观察向

6、量序列O的概率得到最已知有音节序列öqiwuwuersanqiyaoö,或进一大化,即步划分为半音节序列öqiwuwuersanqiy3S=argmaxP(OûS,p1,p2,⋯,pN)(1)Saoö。语音切分的任务是决定音节和音节之间的边但是,对于在语音库建设中的语音切分来说,已有收稿日期:2001207223;修订日期:2002203210第3期张文军,等:基于贝叶斯方法的鲁棒语音切分261的条件是观察序列O和音节序列(p1,p2,⋯,pN),验概率就应该较小。求取最合适的(或最可能的)切分S。因此,这里应首先需要对切分序列S=(t0,t1,⋯,tN)进行一要求在已知观察序列O和音节

7、序列(p1,p2,⋯,些变换,将由切分点构成的序列变为由音节长度构pN)的条件下,产生切分S的概率得到最大化,即成的序列。然后,假设将一段连续语音中每一个音S3=argmaxP(SûO,p节的长度看作是一个一阶的马尔科夫过程,即每一1,p2,⋯,pN)S个音节的长度仅与前一个音节的长度有关,而与更应用贝叶斯公式有3前面的音节无关,我们便可以将每一个音节的长度S=argmaxP(SûO,p1,p2,⋯,pN)=S都用前一个音节的长度作

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。