智能语音的发展过程历史详细概述.doc

智能语音的发展过程历史详细概述.doc

ID:28098475

大小:198.00 KB

页数:9页

时间:2018-12-08

智能语音的发展过程历史详细概述.doc_第1页
智能语音的发展过程历史详细概述.doc_第2页
智能语音的发展过程历史详细概述.doc_第3页
智能语音的发展过程历史详细概述.doc_第4页
智能语音的发展过程历史详细概述.doc_第5页
资源描述:

《智能语音的发展过程历史详细概述.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、智能语音的发展过程历史详细概述    1952年,贝尔实验室(BellLabs)制造一台6英尺高自动数字识别机“Audrey”,它可以识别数字0~9的发音,且准确度高达90%以上。并且它对熟人的精准度高,而对陌生人则偏低。  1956年,普林斯顿大学RCA实验室开发了单音节词识别系统,能够识别特定人的十个单音节词中所包含的不同音节。  1959年,MIT的林肯实验室开发了针对十个元音的非特定人语音识别系统。    二十世纪六十年代初,东京无线电实验室、京都大学和NEC实验室在语音识别领域取得了开拓性的进展,各自先后

2、制作了能够进行语音识别的专用硬件。  1964年的世界博览会上,IBM向世人展示了数字语音识别的“shoeboxrecognizer”。  二十世纪七十年代,语音识别的研究取得了突破性的进展,研究重心仍然是孤立词语语音识别。  1971年,美国国防部研究所(Darpa)赞助了五年期限的语音理解研究项目,希望将识别的单词量提升到1000以上。参与该项目的公司和学术机构包括IBM、卡内基梅隆大学(CMU)、斯坦福研究院。就这样,Harpy在CMU诞生了。不像之前的识别器,Harpy可以识别整句话。  二十世纪八十年代,

3、NEC提出了二阶动态规划算法,Bell实验室提出了分层构造算法,以及帧同步分层构造算法等。同时,连接词和大词汇量连续语音的识别得到了较大发展,统计模型逐步取代模板匹配的方法,隐马尔科夫模型(HMM)成为语音识别系统的基础模型。  八十年代中期,IBM创造了一个语音控制的打字机—Tangora,能够处理大约20000单词。IBM的研究就是基于隐形马尔科夫链模型(hiddenMarkovmodel),在信号处理技术中加入统计信息。这种方法使得在给定音素情况下,很有可能预测下一个因素。  1984年,IBM发布的语音识别

4、系统在5000个词汇量级上达到了95%的识别率。  1985年AT&T贝尔实验室建造了第一个智能麦克风系统,用来研究大室内空间的声源位置追踪问题。  1987年开始,国家开始执行963计划后,国家863智能计算机主题专家组为语音识别研究立项,每两年一次。  1987年12月,李开复开发出世界上第一个“非特定人连续语音识别系统”。  1988年,卡耐基梅隆大学结合矢量量化技术(VQ),用VQ/HMM方法开发了世界上第一个非特定人大词汇量连续语音识别系统SPHINX,能够识别包括997个词汇的4200个连续语句。   

5、 同年,清华大学和中科院声学所在大词库汉语听写机的研制上取得了突破性进展。  1990年,声龙发布了第一款消费级语音识别产品DragonDictate,价格高达9000美元。  1992年,IBM引入了它的第一个听写系统,称为“IBMSpeechServerSeries(ISSS)”。  1992年研发的Sphinx-II在同年美国国防部先进技术研究计划署(DARPA)资助的语音基准评测中获得了最高的识别准确度,这主要得益于其在高斯混合和马尔可夫状态层次上用栓连参数平衡了可训练性和高效性。  1995年,Windo

6、ws95上首次搭载微软SAPI,它使应用程序开发者能够在Windows上创建语音程序。  1995年,AT&T研究院的DaveLadd,ChrisRamming,KenRehor以及CurtTuckey在头脑风暴关于互联网会如何改变电话应用的时候,产生了一些新的想法:为什么不设计这样一个系统来运行一种可以解析某种语音标记语言的语音浏览器,用来把互联网的内容和服务提供到千家万户的电话上。于是,AT&T就开始“电话网络项目”(PhoneWebProject)。之后,Chris继续留在AT&T,Ken去了朗讯,Dave和

7、Curt去了摩托罗拉。(1999年初的时候,他们分别在各自的公司迈出了语音标记语言规范实质性的第一步。因为他们的密友关系,这几家公司合作成立了一个VoiceXML论坛组织,IBM也作为一个创始公司加入了进来。)  1997年IBMViaVoice首个语音听写产品问世,你只要对着话筒喊出要输入的字符,它就会自动判断并且帮你输入文字。次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统ViaVoice’98。  1998年,微软在北京成立亚洲研究院,将汉语语音识别纳入重点研究方向之一。  20

8、01年,比尔盖茨在美国消费电子展上展示了一台代号为MiPad的原型机。Mipad展现了语音多模态移动设备的愿景。  2002年,中科院自动化所及其所属模式科技公司推出了“天语”中文语音系列产品——PattekASR,结束了该领域一直被国外公司垄断的局面。  2002年,美国国防部先进技术研究计划署(DARPA)首先启动了EARS项目和TIDES项目;由于EA

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。