语音信号与文本信息智能处理

语音信号与文本信息智能处理

ID:20524844

大小:51.00 KB

页数:5页

时间:2018-10-12

语音信号与文本信息智能处理_第1页
语音信号与文本信息智能处理_第2页
语音信号与文本信息智能处理_第3页
语音信号与文本信息智能处理_第4页
语音信号与文本信息智能处理_第5页
资源描述:

《语音信号与文本信息智能处理》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、语音信号与文本信息的智能处理第一章概述处于信息革命浪潮时代的今天,人们对于各种各样信息的需求与日俱增,同时人们急切需要更好的信息处理方式。语音,作为人类信息交流的最自然、最有效、最灵活而又最为广泛使用的途径,越来越引起研究者的关注。文本信息,具备易于传播,所需存储空间小等特点,也是人们日常生活中最经常使用的交流方式之一。对语音信号,文本信息的智能处理,正是为了更好地满足人们日益增长的信息需求。智能处理是指能模仿人的智能(归纳,抽象,形式推理、联想和自适应等)的处理.智能(Intelligence)一词源于“Legere"。意思是收集、汇集,它通常指人类

2、的脑力劳动,包括感知、学习、推理和判断等;有人把它定义成是随外界尖化的一种正确的反应能力。人的智能现在己能让电脑机器模仿的主要是学习、推理、联想、判断与自适应的智能。本文着重研究了语音信号与文本信息的智能处理。虽然文本信息和语音信号表面上看起来没有直接的联系,但是对两者的处理方法却有很大的相似之处。因为无论是文本相似判别中使用的特征矢量判别比较,或者是端点检测中利用的判断方法,实际上都是在某一个特定的空间中比较两个矢量的某种距离。说到底,两种处理手段都是一致的。1.1中文信息处理研究的历史与现状概括地说,中文信息处理可分为字处理平台、词处理平台和句处理

3、平台这3个层次。字处理平台的研究与开发,包括汉字编码输入、汉字识别(手写体联机识别与印刷体脱机识别)、汉字系统及文书处理软件等。词处理平台上最典型、最引人瞩目的应用领域是面向Intemet的、文本不受限的中文检索技术,包括通用搜索引擎、文本自动过滤(如对网上不健康内容或对国家安全有危害内容的过滤)、文本自动分类(在数字图书馆中将得到应用)以及个性化服务软件等.目前影响比较大的商品化中文通用搜索引擎有雅虎、搜狐、新浪网等,但这些只用了基于字的全文检索技术,或者仅做了简单的分词处理,性能还有待于提高。国内研究机构做得比较好的是北京大学的天网,它用了中文分词

4、和词性自动标注技术,但不足之处在于覆盖能力有限,设计上也稍嫌粗糙。词平台上另一个重要应用是语音识别。单纯依赖语音信号处理手段来大幅度提高识别的准确率,已经很难再有大的作刀了,必须要借助文本的后处理技术.现在第一意概述最具代表的产品是IBM的中文ViaVioce>微软中国研究院也有表现不俗且接近实用的系统。国内在做这方面工作的有清华大学计算机系、电子系、中科院声学所和自动化所等,但从技术走向市场还有一段距离。属于这个平台的其他应用还有文本自动校对、汉字简繁体自动转换等。句处理平台上的重要应用主要有两方面:一是机器翻译,虽然目前机器翻译的质量还远远不能令人

5、满意,但挂靠在Internet上,就找到了适当的舞台,无论对中国人了解世界(英译汉),还是外国人了解中国(汉译英),都大有裨益,潜在的市场十分可观。“金山快译”软件受到市场的欢迎,就是一个有说服力的旁证。此外,雅信诚公司推出的针对专业翻译人员的英汉翻译辅助工具CAT,虽然没有采用全自动翻译的策略,但定位及思路都非常好,不失为另一个有前途的发展方向。句处理平台上另一方面的重要应用是汉语文语转换,不诉诸句法分析技术以获得句子的韵律结构,要获得理想的自然度是不可能的。“金山词霸”里嵌入了英文文语转换技术,相信用户将对这一功能有深刻的印象。总的说来,字平台研究

6、己快成昨日黄花;句平台上的研究还很薄弱,离实用还有一段距离;而词平台上的研究,难度较句平台容易,且经过十几年的努力,成果也比较扎实,随着Intemet的发展,己经到了厚积薄发的时候。1.2语音识别的发展历史与现状关于语音识别的第一篇论文是1952年美国贝尔实验室发表的关于孤立数字识别系统的研究论文。接着美国的RCA研究所进行了单音节识别系统的研究。在非特定人语音识别方面的尝试,是1959年美国MIT研制的元音识别装置。到六十年代中后期,语音识别作为一个重要的研究课题而展开,并且逐步取得实质性的进展。这是因为一方面计算机产业的发展提出了使用的要求,同时又

7、提供了实现复杂算法的软硬件环境;另一方面数字信号处理的理论和算法在那个时代取得飞跃的进展,如快速傅里叶变换(FFT)、倒谱计算、线性预测分析(LPC),数字滤波等。日本学者板仓(Itakura)将动态规划(DP)的概念用于解决孤立字识别时说话速度不均匀的问题,提出了著名的动态时间弯曲算法(DTW)e早期的语音识别系统都是按照简单的模板匹配原理工作的特定人、小词汇表、孤立词识别系统。DTW算法克服了说话人语速不均匀造成的时间伸缩变化的影响,使系统的性能有了显著的提高。但是对于更高要求的语音识别系统这种简单的机制则有些力不胜任。例如,由于词汇表的扩大和孤立

8、词语音识别转向连续语音识别,无法象孤立词识别那样以词作为基本识别单元。如果采用音节或者音素作为

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。