语音识别技术介绍

语音识别技术介绍

ID:33555253

大小:474.50 KB

页数:34页

时间:2018-05-12

语音识别技术介绍_第1页
语音识别技术介绍_第2页
语音识别技术介绍_第3页
语音识别技术介绍_第4页
语音识别技术介绍_第5页
资源描述:

《语音识别技术介绍》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、语音信号处理与识别一、语音识别概述二、语音识别系统基本原理三、预处理及特征参数提取四、模板匹配技术及相似性判断方法五、语音识别系统的设计和实现语音识别概述让机器听懂人类的语音,这是人们长期以来梦寐以求的事情。伴随计算机技术发展,语音识别己成为信息产业领域的标志性技术,在人机交互应用中逐渐进入我们日常的生活,并迅速发展成为“改变未来人类生活方式厅的关键技术之一。语音识别技术以语音信号为研究对象,是语音信号处理的一个重要研究方向。其最终目标是实现人与机器进行自然语言通信。发展和现状:20世纪50年代,AT&TBell(贝尔)研究所成功研

2、制了世界上第一个能识别10个英文数字的语音识别系统一Audry系统,这标志着语音识别研究的开始。60年代计算机的应用推动了语音识别的发展。这一时期的重要成果是动态规划(DynamicProgramming,DP)和线性预测分析(LinearPredictive)技术。其中后者较好的解决了语音信号产生的模型问题,对语音识别产生了深远的影响。语音识别概述70年代语音识别领域取得了突破。在理论上,LP技术得到进一步发展,动态时间规整技术(DTW)的基本成熟,特别是提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。在实践上,小词汇量孤立

3、词的识别方面取得了实质性的进展,实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。这一时期的语音识别方法基本上是采用传统的模式识别策略。80年代语音识别研究进一步走向深入,其显著特征是HMM模型和人工神经元网络(ANN)在语音识别中的成功应用。HMM模型的广泛应用应归功于AT&TBel实验室的Rabiner等科学家的努力,他们把HMM纯数学模型工程化,从而为更多研究者了解和认识。研究的重点逐渐转向大词汇量、非特定人连续语音识别。90年代,随着多媒体时代的来临,在语音识别技术的应用及产品化方面出现了很大的进展。许多发达国家如

4、美国、日本、韩国以及IBM,Apple,AT&T,NTT等著名公司都为语音识别系统的实用化开发投以巨资。语音识别技术实用化进程大大加速,并出现了许多实用化产品。IBM公司率先推出的汉语ViaVoice语音识别系统,带有一个32,000词的基本词汇表,可以扩展到65,000词,平均识别率可以达到95%,可以识别上海话、广东话和四川话等地方口音,是目前具有代表性的汉语连续语音识别系统。语音识别概述21世纪语音识别技术的应用及产品化方面进一步发展。在语音识别产品方面,各大公司纷纷推出自己产品。目前世界上最先进的语音识别软件,既不是微软生产

5、的,也非IBM制造,它的名字叫做NaturallySpeaking,出自于NuanceCommunications公司。NaturallySpeaking己经得到了大多数用户的认可。用户对着麦克风说话,屏幕上就显示出说话的内容,很容易识别和纠正错误.久而久之,该软件就会适应用户的说话风格。我国语音识别研究工作起步于五十年代,但近年来发展很快,研究水平也从实验室逐步走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平己经基本上与国外同步,在汉语

6、语音识别技术上还有自己的特点与优势,并达到国际先进水平。其中,具有代表性的研究单位是清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。由清华大学电子工程系语音技术与专用芯片设计课题组研发的非特定人汉语数码串连续语音识别系统,识别精度达到了94.8%(不定长数字串)和96.8%(定长数字串).语音识别概述语音识别系统分类:从说话者与识别系统的相关性分:(1)特定人语音识别系统:仅考虑对于专人的话音进行识别,与说话的语种没有关系;(2)非特定人语音识别系统:识别的语音与人无关,通常要用大量不同人的语音数据库对识别系统进行学习

7、,识别的语言取决于采用的训练语音库;(3)多人的识别系统:通常能识别一组人的语音该系统通常要求对该组人的语音进行学习,通常可以识别三到五个人的语音。从说话的方式分:(1)孤立词语音识别系统:其输入系统要求输入每个词后要停顿;(2)连接词语音识别系统:其输入系统要求对每个词都清楚发音,开始出现一些连音现象;(3)连续语音识别系统:连续语音输入自然流利的语音,会出现大量的连音和变音。另外从识别系统的词汇量大小分:小词汇量语音识别系统(几十个词);中等词汇量语音识别系统(几百到上千个词);大词汇量语音识别系统(几千到几万个词)。语音识别概

8、述语音识别的基本方法:一般来说,语音识别的方法有三种:基于声道模型和语音知识的方法、模板匹配的方法以及利用人工神经网络的方法。(1)语音学和声学的方法该方法起步较早,在语音识别技术提出的开始,就有了这方面的研究,但由于其模型及语音知识

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。