系统语音识别的研究现状和应用

系统语音识别的研究现状和应用

ID:41811704

大小:38.50 KB

页数:4页

时间:2019-09-02

系统语音识别的研究现状和应用_第1页
系统语音识别的研究现状和应用_第2页
系统语音识别的研究现状和应用_第3页
系统语音识别的研究现状和应用_第4页
资源描述:

《系统语音识别的研究现状和应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、语音识别的研究现状和应用摘要21背景介绍22发展历史23具体应用24语音识别系统原理35现有算法介绍36尚未解决的问题及值得研究的方向4语音识别技术是一门涉及而很广的交义学科。随着新理论的提出和应用,语音识别技术取得了很大的进步,许多产品已经得以实际的应用,但在其进一步的发展进程中,还有许多软手的问题有-待解决。关键词:语音识别;动态时间规整算法;人工神经元网络。1背景介绍语言是人类特有的功能,是人们思维最重要的寄托体,是人类交流最主要的途径。语音是语言的声学表现,是人类交流信息最口然、最有效、最方便的手段。语言和语音与人类社会科学文化发展紧密相连。语咅识别技术是让机器

2、接收,识别和理解语咅信号,并将具转换成相应的数字信号的技术。它是一门交叉学科,涉及到语音语言学、数理统计、计算机、信号处理等一系列学科。2发展历史1952年贝尔实验室的Davis等人研制成功了能识别十个英文数字发音的Audry系统,标志着语音识别技术研究工作开始。2()世纪60年代计提出了动态规划(Dynamicprogramming)和线性预测分析技术(LinerPredictive)等重要成果。2()卅纪7()年代,语音识别领域取得了突破。实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。20世纪80年代语音识别研究进一步走向深入,基丁特定人孤立语音技术的

3、系统硏制成功,隐马尔可夫模型和人工神经元网络(ArtificialNeuralNetwork)在语咅识别中的成功应川。进入20世纪90年代后语音识别系统开始从实验室走向实川。我国对语音识别的研究开始于20世纪8()年代,近年来发展迅速,并取得了一系列的成果。3具体应用随着计算机技术、模式识别等技术的发展,适应不同场合的语咅识别系统相继被开发出来,语音识别及处理技术已经越来越突现出其强人的技术优势。近三I-年来,语音识别在计算机、倍息处理、通信与电子系统、自动控制等领域的应用越來越广泛。在许多政府部门、商业机构,语音识别技术的应用,可免除大量操作人员的重复劳动,既经济乂方

4、便。如:语音邮件、ip电话和IP传真、电子商务、白动语音应答系统、H动语音信箱、基于IP的语音、数据、视频的CTI系统、综合语音、数据服务系统、自然语音识别系统、专家咨询信息服务系统、寻呼服务、故障服务、秘帖服务、多媒体综合信息服务、专业特别服务号(168自动信息服务系统,112、114、119等信息查询系统)等。许多特定环境下,如工业控制方而,在一些工作环境恶劣、对人身有伤害的地方(如地下、深水及辐射、高温等)或手工难以操作的地方,均可通过语音发出相应的控制命令,让设备完成各种工作。当今,语咅识别产品不仅在人机交互中,占到的市场比例越來越大,而H•在许多领域都冇了广阔

5、的应用前景,在人们的社会生活中起着举足轻重的作用。4语音识别系统原理语音识别一般分为两个步骤:学习阶段和识别阶段。学习阶段的任务是建立识别基本单元的声学模型以及语言模型。识別阶段是将输入的口标语音的特征参数和模型进行比较,得到识别结果。语咅识别过程如图所示。下面对该流程作简单介绍:(1)语音采集设备如话筒、电话等将语音转换成模拟信号。(2)数字化一般包括预滤波、采样和A/D变换。该过程将模拟信号转变成计算机能处理的数字信号。(3)预处理一般包括预加重、加窗分帧。经预处理后的信号被转换成了帧序列的加窗的短时信号。(4)参数分析是对短时信号进行分析,提取语音特征参数的过程,

6、如时域、频域分析,矢量量化等。(5)语音识别是目标语音根据特征参数与模型库中的参数进行匹配,产牛识别结果的过程。一般有模板匹配法、随机模型法和神经网络等。(6)该过程是语音模型的学习过程。5现有算法介绍语音识别常用的方法有:模板匹配法、人工神经网络法。(1)模板匹配法是语音识别中常用的一种相似度计算方法。模板匹配法一燉将语音或单词作为识别单元,一般适用于词汇表较小的场合。在训练阶段,对用户语音进行特征提取和特征维数的压缩,这个过程常用的方法是采用矢量量化(VQ)技术。然后采用聚类方法或其他方法,针对每个模式类各产生一个或几个模板。识别阶段将待识别的语咅模式的特征参数与各

7、模板进行相似度的计算,将最高相似者作为识别结果。但由于用户在不同时刻发同一个音的时间长度有较大随意性,所以识别时必须对语音时间进行伸缩处理。研究表明,简单的线性伸缩是不能满足耍求的。由日本学者板仓在70年代提出的动态吋I'可伸缩算法(DTW)很好的解决了这一问题。DTW算法能够较好地解决小词汇量、孤立词识别时说话速度不均匀的难题。设测试的语音参数共有M帧矢量,而参考模板有N帧欠量,TLMHN,则DTW就是寻找一个时间归整函数tn=f(tm),它将测试欠虽的时间轴tm非线性地映射到模板的时间轴tn±,并使该函数满足第k帧(k=l,2,・・・

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。