基于tts汉语发音动态时间弯曲评测法

基于tts汉语发音动态时间弯曲评测法

ID:24424147

大小:50.00 KB

页数:4页

时间:2018-11-14

基于tts汉语发音动态时间弯曲评测法_第1页
基于tts汉语发音动态时间弯曲评测法_第2页
基于tts汉语发音动态时间弯曲评测法_第3页
基于tts汉语发音动态时间弯曲评测法_第4页
资源描述:

《基于tts汉语发音动态时间弯曲评测法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于TTS汉语发音动态时间弯曲评测法:汉语学习日趋广泛,如何快速有效地实现标准汉语语料库供学习者参考并对汉语学习者的发音标准水平做出评测受到了很大程度的关注。该文介绍微软提供的TTS语音引擎,阐述其编程实现过程,利用TTS生成的汉语音频作为标准语料库。采集汉语学习者发音,对TTS生成的汉语音频和汉语学习者的发音作预处理并提取特征值,最后采用DTethodofDTicrosoftSimplifiedChinese,这样就可以合成汉语文字了,如果使用的是ode.SSFMCreateForel倒谱参数(MFCC)等。  3.1短时能量和过零率 

2、 由于采用TTS发音引擎可以连续发出(或者汉语学习者在跟读TTS语音)一个字、一个句子、一篇文章的读音,因此需要端点检测技术区分每个字读音的开始与结束。端点检测技术是通过设定短时平均能量和过零率的门限实现的。短时能量的概念来描述语音信号的幅度,短时能量对浊音敏感,因为浊音为声带振动发出,语音信号有幅度高的特点。过零率对清音敏感,由于清音段是口腔空气摩擦产生的效果,所造成的波形在幅度上的变化比较剧烈,可以用一帧信号中波形穿越零电平的次数来描述这种变化剧烈程度。  短时平均能量指在一个短时音频内采样点信号所聚集的平均能量。假定一段连续音频信号

3、流x得到K个采样点,这K个采样点被分割成叠加率为50%的M个短时帧(通常语音的特征提取都采用有叠加的帧进行处理的),其短时平均能量使用下面公式计算:(其中,x(n)表示第m个短时帧信号中第n个采样信号值,帧,其过零率计算如下:  其中,x(n)表示第m个短时帧信号中第n个采样信号值,),…,R(M)}。所要识别的一个输入连续音频流的各个词语特征值组成的模板称为测试模板,测试模板中一个词语的特征值可表示为T={T(1),T(2),…,T(n),…,T(N)}。参考模板与测试模板采用相同类型的特征矢量MFCC、相同的帧长、相同的窗函数和相同的

4、帧移。  DT在纵轴上标出,通过这些表示帧号的整数坐标画出一些纵横线即可形成一个X络,X络中的每一个交叉点(n,m)表示测试模式中某一帧的交汇点,如图5所示。  为了约束搜索路径倾斜度,将决策变量即搜索路径斜率范围限定为η,η={012},如果路径已经通过了格点(ni-1,mi-1),那么下一个通过的格点(ni,mi)只可能是下列三种情况之一:  匹配阶段的状态决定某一阶段以后过程的发展不受这阶段以前各段状态的影响,过程的每一次实现可以用一个状态序列表示,每阶段的状态是该线路的始点,确定了这些点的序列,整个线路也就完全确定。从某一阶段以后

5、的线路开始,当这段的始点给定时,不受以前所通过的X络点的影响。  阶段的状态控制该状态到下一阶段某个状态的演变,因状态满足无后效性,故在每个阶段选择决策时只需考虑当前的状态而无须考虑过程的历史,给定第ni-1阶段状态变量d[T(ni-1),R(mi-1)]的值后,如果这一阶段的决策变量一经确定,第ni阶段的状态变量d[T(ni),R(mi)]也就完全确定。算法的实现从(n1,m1)点开始搜索,到(nN,mM)结束。匹配的最优策略表示为以η为约束条件,求最佳路径函数mi=Ф(ni),使得沿路径的积累距离达到最小值dist如下所示:  自动评

6、分模块建立了一套利用标准语音资料评分的评分机制,首先设定测试语音与标准语音两相同特征比对之后的结果,其距离与分数间的关系,设定公式如下:  由这个公式我们就可以将距离转换成分数,只要设定好两组的dist及对应的score,即可从中求出a和b,接着由距离值可以计算出对应的分数。当有测试语音进来时,我们和标准语音比较梅尔倒频谱参数,算出距离dist后,即可计算出评分分数。  5结束语  目前计算机辅助汉语教学系统通常采用的标准普通话示教音频数据采集过程繁重,要求(播音员级)男女标准普通话教师数十名来录制大词汇量示教音频,如此浩大的工程给汉语学

7、习推广带来了一定的阻力,本文采取微软TTS标准合成语音作为标准语音库,避开了上述繁重的工程,为实验提供了方便性、可行性。如何提取更加有效的特征值组合,采用何种算法能取得实行性、高效性、匹配的精确性,以及评分机制上追求全面性是本文的下一步主要研究工作。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。