简单语音识别系统的设计与开发.pdf

简单语音识别系统的设计与开发.pdf

ID:56484963

大小:36.52 KB

页数:3页

时间:2020-06-24

简单语音识别系统的设计与开发.pdf_第1页
简单语音识别系统的设计与开发.pdf_第2页
简单语音识别系统的设计与开发.pdf_第3页
资源描述:

《简单语音识别系统的设计与开发.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第6期(总第93期)机械管理开发2006年12月No.6(SUMNo.93)MECHANICALMANAGEMENTANDDEVELOPMENTDec.2006简单语音识别系统的设计与开发李娜(陕西理工学院计算机科学与技术系陕西汉中723003)【摘要】提出一种基于矢量量化VQ语音识别方法,在VC++环境下模拟实现一个简单的小词汇量、孤立词语音识别系统,此系统有广阔的应用前景。【关键词】语音识别模式识别信号处理矢量量化【中图分类号】TP391【文献标识码】B【文章编号】1003-773X(2006)06-0082-03引言用它来完成一些简单的语音提示功能,

2、根据我们系统计算机的普及化、家电化,使各种类型的计算平台的要求,使用MCI可以简单地完成设计任务,因此我们都需要更简便的输入媒体,语音识别当仁不让成为用选用这个方法进行信号的采集。户最佳的选择之一。语音识别就是机器通过识别和理1.2语音信号的处理解把语音信号转变为相应的文本文件或命令的高技语音信号处理是这次设计的关键,实现技术可采术。计算机自动语音识别的任务是研究如何利用计算用以下几种:(1)使用WINSDK,这是Windows自带的机从人的声学语音信号中提取有用信息,并从中确定一个语音开发包,使用它可以完成一些简单的语音信语音信号的语言含义。目前,语音识

3、别技术在计算机软号的识别。(2)使用第三方提供的语音开发包,主要使硬件的推动下,经过几十年的探索已经达到了相对较用其中的语音识别引擎,如IBM提供的VIAVOICE引高的水平。开发一个可以移植到或者可以在单片机上擎。(3)将语音信号经过一些数字信号处理后,找到可实现语音识别系统具有很大的应用前景。因此,本次设以描述语音的一些特征值(如:过零率、短时能量、LPC计通过对语音识别的研究,在VC++上模拟实现一个简系数、LPC系数倒谱等),将这些特征值组成一个特征单的小词汇量、孤立词识别系统,以使我们的实现算法向量,进行识别。可以移植到单片机上,使单片机具有更高

4、的智能性。在(1)和(2)中,Windows和IBM为我们封装了语音1需求分析和方案论证识别引擎,使我们不必了解语音信号处理和信号识别本次设计以语音识别在工业控制中的应用作为目的整个过程就可以很方便地得到语音识别的结果。使标,使用VC++来完成一个可以移植到单片机上的小词用这种方案,对我们的实践没有好处,不符合我们设计汇量、孤立词语音识别系统。的实际。在(3)中,我们可以掌握实现语音识别的详细1.1语音信号采集过程,为以后从事这方面的研究奠定坚实的基础。例如目前语音信号的采集可以使用以下几种方法:(1)在进行语音信号处理中,要提取哪些特征值,提取的特使用低

5、级编程技术:使用低级编程技术对编程人员的征值突出了语音信号的哪些特点等等。鉴于设计要节要求比较高。首先,要求编程人员熟悉声卡的物理结约成本,并且要掌握语音信号处理的相关知识,我们选构、端口设置、缓冲区操作等工作原理;其次,要求编程择方案(3)。人员掌握低级编程和高级编程之间的接口。使用这种1.3匹配模式的选择方案较复杂,所以我们放弃这种方案。(2)使用WIN可参考的方案有:(1)动态时间规正(DTW);(2)API:WINAPI是微软推出的处理音频信号的低级API矢量量化的距离(VQ);(3)隐马尔可夫模型(HMM);函数,它直接操纵语音设备,可以完成对语

6、音信号缓冲(4)人工智能、神经网络和模糊识别。区和语音信号精确的控制。如果要在单片机上实现语DTW是基于小词汇、孤立词的语音识别系统。识音信号的实时处理,这个方案不适合,因此我们不选别率比较高,但对大词汇量、连续语音识别贡献不大。用。(3)使用媒体控制接口(MCI):使用MCI是对音频矢量量化(VQ)技术是继DTW之后的一种识别方式。它处理最常用的一种方法,它把音频设备封装起来,仅留将一组特征值组成一个特征值矢量,通过对特征值适给用户一些使用接口,这大大地方便了用户对声音的量的匹配来实现识别。这种方法在语音识别领域中被处理。编程人员只需要熟悉这些命令就能完

7、成大部分广泛使用,在提高语音识别精度方面做出了很大的贡的工作。使用MCI编程简单、控制方便。因此,我们可使献。HMM是继VQ后出现的一种基于概率的识别方式,作者简介:李娜,女,1979年生,西安电子科技大学在读硕士研究生,助教。·82·第6期(总第93期)机械管理开发2006年12月主要在大词汇、连续语音识别中使用。人工智能、神经(4)特征库管理模块。特征库的相关参数:1)声音网络和模糊识别是最近十几年发展起来的新兴的学文件名、说话人名、说话的内容;2)经过信号处理后得科,其中一些技术应用到语音识别中来,处于发展阶到的这个人关于说话内容的语音特征值参数:短

8、时过段,尚不完善。零率、短时能量、自相关、12阶LPC倒谱系数等,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。