和神经网络的汉语数字语音识别研究

和神经网络的汉语数字语音识别研究

ID:34533117

大小:1.65 MB

页数:59页

时间:2019-03-07

和神经网络的汉语数字语音识别研究_第1页
和神经网络的汉语数字语音识别研究_第2页
和神经网络的汉语数字语音识别研究_第3页
和神经网络的汉语数字语音识别研究_第4页
和神经网络的汉语数字语音识别研究_第5页
资源描述:

《和神经网络的汉语数字语音识别研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、苏州大学硕士学位论文基于听觉特性和神经网络的汉语数字语音识别研究姓名:张晓俊申请学位级别:硕士专业:检测技术与自动化装置指导教师:陶智20070501基于听觉特性和神经网络的汉语数字语音识别研究作者:张晓俊学位授予单位:苏州大学相似文献(10条)1.学位论文黄颖噪声环境下汉语数字语音识别研究2004噪声环境下汉语数字语音识别是当前汉语数字语音识别走向商业化的必由之路,由于其巨大的应用前景,因而这方面的研究成为国内外语音识别的热点.该文利用语音增强和汉语数字语音识别的方法构造一个噪声环境下的汉语数字语音识别系统.实验过程中,语音识别部分

2、所用的语音采用的是干净语音加噪后经语音增强后输出的语音.该文针对传统ANC系统收敛慢,系统稳定性不高的缺点,提出了一种新的双自适应噪声抵消系统,该系统用NLMS算法作主滤波器的控制算法,用DLMS作为从滤波器的控制算法,由于采用变步长控制算法,系统的稳定性和收敛性明显得到改善.在实验中,该系统能很好地抵消语音中的噪声,提高语音信噪比,为下面的语音识别率提高提供保证.在语音识别中,大词汇量、非特定人、连续语音识别一直是一个难以攻克的问题.该文采用26维特征(包括12维MFCC参数、1维归一化能量和它们的一阶差分)和HMM模型进行建模,对

3、非特定人和汉语数字语音识别进行实验,共作了如下工作:1.探讨了训练数据对模型的二个重要参数—状态数和混合度的影响.当模型训练不足时,状态数的增加和输出概率混合度的增加会增加系统误识率;模型训练充足时,状态数的增加和输出概率混合度的增加会减少系统误识率.2.在一般的汉语数字语音识别系统中,由于易混淆数字对"1(yi1)"和"4(si4)"、"3(san1)"和"4(si4)","6(liu4)"和"9(jiu3)"的存在,系统替代错误(如1被4替代)较高,实验结果表明部分概率识别法能降低这种系统替代错误.3.该文采用静默音模型来简化端点

4、算法,减少了在大量语料的情况下,自动端点检测计算量大,手工标注端点检测工作量大的问题.4.在非特定人、连续语音识别中,基元的选择关系到模型的规模,识别的准确率和系统的可扩展性,该文通过实验比较,得出声韵母模型更适合汉语数字建模.5.汉语数码中,由于"2"、"5"是单音素构成,连续时易造成删除错误,该文利用持续时间模型减少了这种错误率.6.该文针对训练数据稀疏进行了探讨,在状态空间共享时,训练数据的稀疏问题得到很好的解决.2.期刊论文杨建华.赵力.YangJianhua.ZhaoLi基于VQ与HMM相结合的汉语数字语音识别-南京航空航天

5、大学学报(英文版)2000,17(1)提出了一种新的语音识别方法,它结合了VQ-误差和离散HMM两种方法,用VQ-误差全面替代了在离散HMM中运用的离散输出.这种方法被看作是由Burton等人提出识别方法的VQ-误差的一种改进型,但也被认为是混合的分散密度HMM的一种特殊情况.文中不仅描述了基于HMM的VQ-误差,并且通过实验,在语音识别性能方面将之与传统的HMM方法进行了比较,证实其优于传统的HMM方法.3.学位论文陶世焰汉语数字语音识别2000该文重点在三个方面对汉语数字语音识别进行研究和分析:(1)特征参数的提取.通过对线性预测

6、系数、自相关系数、声道面积比系数和对数面积比系数、PARCOR系数、Mel倒谱、LPC倒谱等特征参数的提取加以比较,选择对于汉语数字语音识别最有效的特征参数;(2)识别方法的选择.对于孤立汉语数字语音识别,研究人员分别用了DTW方法和HMM方法进行识别,为了提高训练集外说话者的正确识别率,一种可能是进一步提高参与训练者的数量,另一种可能是为每个数字建立多套HMM参数;(3)全文总结了汉语数字语音识别的发展现状,分析了汉语数字语音识别中的高混淆度所导致的识别困难,比较了各种实现方法,介绍了作者在实验基础上的一些基本参数以及提出了一些改进

7、方法.4.学位论文张静亚基于HMM的汉语连续数字语音识别2005连续数字语音识别在现实中具有广泛的应用前景。在互连网、通信、军事、国防、人机交互等方面都有着重要的应用价值。  多年来,许多学者都致力于连续数字语音识别的研究。但是,同英语连续数字语音识别情况相比,汉语连续数字语音识别的现状同实际应用的要求还存在一定的差距。主要难点在于,首先汉语是单音节字,音节越少语音间的混淆程度越高,存在一些容易混淆的数字对,如“2”和“8”,并且汉语数字中还存在一些单元音数字,如“1”、“2”和“5”,这些数字的连续发音序列(如“55”)的识别相当困

8、难,识别过程中很容易引起数字“误插入”和“误删除”。  为了得到一个高性能、低运算量的非特定人连续数字语音识别系统,本文在识别算法中做了多种分析和改进,研究了结合韵律特征信息来提高HMM连续数字语音识别性能的算法。实验证

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。