基于dtw算法的语音识别系统实现new

基于dtw算法的语音识别系统实现new

ID:33938726

大小:328.76 KB

页数:5页

时间:2019-02-28

基于dtw算法的语音识别系统实现new_第1页
基于dtw算法的语音识别系统实现new_第2页
基于dtw算法的语音识别系统实现new_第3页
基于dtw算法的语音识别系统实现new_第4页
基于dtw算法的语音识别系统实现new_第5页
资源描述:

《基于dtw算法的语音识别系统实现new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、万方数据第30卷第7期2004年7月电字工皇丽ELECTRONICENGINEERV01.30No.7Jul.2004基于DTW算法的语音识别系统实现吴晓平,崔光照,路康(郑州轻工业学院信息与控制工程系,河南省郑州市450002)【摘要】动态时间归整(D聊)算法的实现简单有效,在孤立词语音识别系统中得到了广泛的应用。介绍了将D珊算法移植到TMS320VC5402上实现孤立词语音识别的原理、系统硬件组成和软件设计。研究结果表明,系统能满足实时性能要求,识别效果良好。关键词:动态时间归整(DTw)算法,语音识别,线性预测,端点检测中图分

2、类号:TN912.340引言动态时间归整(DTW)算法是把时间归整和间距测量计算结合起来的一种非线性归整技术,与隐式马尔可夫模型(HMM)算法相比,它不是一种有效的利用统计方法进行训练的算法,同时,也不容易将底层和顶层的各种知识用到识别算法中,在解决大词汇量、连续语音、非特定发音人语音识别系统时,识别效果较差,但在孤立词语音识别系统中识别效果良好,并且,由于DTW算法计算量较少。因此,DTw算法在孤立词语音识别系统中得到了较为广泛的应用。将嗍算法移植到TMs320VC5402上实现语音识别,能满足实时性要求。1识别系统基本原理图l是

3、实时语音识别系统的结构框图。图1语音识别系统原理框图语音信号的数字化包括预滤波和A/D采样。语音信号的频率一般介于100Hz~3400Hz之间,需设计一个带通滤波器以便滤去语音信号频率以外的干收稿日期:2004彤.24扰。语音信号经滤波和采样后,由A/D转换器转换为二进制数字码。语音信号的预处理一般包括预加重、加窗和分帧处理。预加重的目的是提升高频部分,使信号的频谱变得平坦,以保持在信号的整个频带内具有同样的信噪比,便于声道参数分析。在语音信号的数字处理中常用的是矩形窗和汉明窗等,窗口的形状、长度对短时分析参数的影响很大,为此,应选

4、择合适的窗函数。语音信号有10ms~30ms的短时平稳性,一般每秒的帧数为33帧一100帧。为了使帧与帧之间平滑过渡,前一帧与后一帧之间必须保持一定的帧移,帧长与帧移的比值一般取为O~l/2。语音信号的端点检测一般采用平均能量、平均幅度值、平均过零率等或上述几种方法的综合来判断,也有一些学者提出采用频带方差、倒谱特征等方法来判断。采用前者算法的计算量较小,在噪声不大的环境下可以有效地判别语音信号的起始点与终止点。在端点检测时若选择的窗长较大,可以加快语音处理的速度,会跳过一些短时噪声,但是端点检测的误差会增加。语音信号的端点检测直接

5、影响语音信号倒谱特征提取的误差,为此,应选择合适的端点检测算法。由于语音信号之间存在相关性,可以用过去的样点值来预测现在的或未来的样点值,即一个语音的采样值可以用过去若干个语音采样或它们的线性组合来逼近。通过线性预测采样与实际语音采样之间的误差达到最小值来决定唯一的一组预测系数。线性预测系数(LPC)倒谱运算采用声道系统函数中的最小相位特性,避免了相位卷绕问题,并且,LPC倒谱运算量较F丌求倒谱运算量小,在实时语音识别中经常采用LPC倒谱作为特征矢量。在线性预测分析过程中,若选择的阶数p很大,LPc的值出现振荡,其携带的信息会使语音

6、的内在特征出现很大的随机性,一般选择.p在8~14之间。·17·万方数据.通信技术·电子工曩师2004年7月2实时识别系统的实现2.1识别系统的硬件组成为了实现实时语音识别,采用TMS320VC5402为主控芯片,可以在rI'I公司推出的TMS320VC5402DSK开发平台上实现,其最小系统硬件组成可参考图2。嫂呕m刚燮_I。:懋叱H,:涨美。:H;潞晶僦1320AD50Crl320VC5402l卜1F1asIl存储器扬声器刭L——一L———卅堕塞茎旦图2语音识别系统硬件组成框图TMS320VC5402是TI公司生产的一种性价比较

7、高的16位定点DsP。它的指令周期为10ns,具有运算速度快、通用性强、接口连接方便等特点,适合在语音编码和通信中应用。TLC320AD50c是TI公司生产的∑-△型单片音频接口芯片,它集成了16位A/D和D/A转换器,采样速率可通过DsP编程来设置,最高可达22.05kbiL/s。TLC320AD50C内部D/A转换器之前有插值滤波器,A/D转换器之后有采样滤波器,接收和发送可同时进行。TMS320VC5402芯片包括2个高速、全双工多通道缓存串行McBSPs口。McBSPs提供了全双工的通信机制、128通道的接收和发送,数据长度

8、可以在8位、12位、16位、20位、24位或32位中选择。采用多通道缓存串行McBsPs口实现TLC320AD50c芯片的数据采集,采用串行通信方式,采样频率可由TLc320AD50c的控制寄存器设置。在进行串行口通信之前,需要对TL

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。