基于语音识别的语种识别研究

基于语音识别的语种识别研究

ID:34112534

大小:57.11 KB

页数:3页

时间:2019-03-03

基于语音识别的语种识别研究_第1页
基于语音识别的语种识别研究_第2页
基于语音识别的语种识别研究_第3页
资源描述:

《基于语音识别的语种识别研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于语音识别的语种识别研究陈瀛长沙市南雅中学摘要:围绕语种识别进行研讨,并采用LangidT具进行实验。由于在多语音语言识别系统中扮演着重要角色,所以在信息检索、国家安全和军事领域具有重要的作用。关键词:语音识别;Langid;语种识别;0前言语咅识别是使计算机经过训练算法把语咅信号转变为计算机可以理解的文本,简单來说就是使计算机理解人的语音。例如,字符序列、按键或二进制编码等。语音识别有两个研究方向,即语种识别和说话人识别。围绕语种识别进行研讨,并采用Langid工具进行实验,语种识别是指计算机通过理解和识别过程判定输入

2、语音的语种。语种识別,在多语音语言识別系统中扮演着重要的角色,它在信息检索、国家安全和军事领域扮演着越來越重要的角色。1语音识别概述(1)语音识别介绍。语音识别也称为自动语音识别,目的是使计算机能自动将人类的输入语音转化成为相应的文木文字。语音识别技术所涉及的相关领域有模式识别、信号处理、信息论和概率论、听觉机理和发声机理、人工智能等。运用领域,如语咅文档检索、简单的听写数据录入、语音拨号、室内设备控制、语咅导航等。(2)语音识别发展。1952年由AT&T贝尔实验室研究人员开发的Audrey语音识别系统是最早的基于电了计算

3、机的语音识别系统,它是通过提取语音中元音的共振峰来完成的。1959年,伦敦学院的Denes研究岀来了语法概论,并将其加入到语音识别领域的研究屮,这是语音识别第一次运用统计学的原理。同年美国的林肯实验室成功生产出了10个元音单元的语音识别器。20世纪60年代的3大突破是:线性预测编码;前苏联科学家Vintsyuk提出的动态时间规整技术;隐马尔科夫模型的应用。2研究背景及意义(1)研究背景。由于全球化趋势的快速发展,国际交流不断加深,多语言交流的需求也在加大,迫切需要有一种机器能够代替人类进行多语言的学习,从而提高生产效率,促

4、进社会进步。在此大背景下尝试通过实验等方式,探求出一个语种识别的方法。(2)语种识别的意义。语种识别在信息检索和军事领域都扮演很重要的角色,包括多语言信息补偿/自动转换服务等。从微观上说,多语种识别可应用在跨国酒店和机场咨询等场所。例如,客户打电话时,系统识别说话人的语种信息,分配给掌握相应语音的客服人员分机上,进而提供相应服务;从宏观上说,在国家信息化服务方面,多语言服务的一些客户需求逐步出现在一些多信息查询系统上,可实现多语种的输入。随着信息时代的到来,语种识别越来越显示出重要的应用意义。3语种识别发展及研究方法3.1

5、语种识别基本流程2种语种识别的方法,即根据语音进行语种识别和根据文本进行语种识别。实验部分采用的是第二种语种识别方法(图1)o图1根据语音进行语种识别流程下载原图根据语音进行语种识别有3个过程,即语音信号特征提取,语种模型构建和判决规则。自动语种识别包含训练阶段和识别阶段。在训练阶段,系统会提取不同种语咅数据的特征,然后转变成一个特征向量序列,利用一些相应的训练算法,最后产生一个或多个参考模型并存储起來。在识别阶段,输入一些待识别的语音数据,然后提取特征,根据训练阶段训练好的对应语音或语言模型进行相似度度量,得到一个相似性

6、得分。判决模块根据该和似度得分给出识别判决结果,也就是识别出的语种信息。3.2语种识别的传统方法(1)传统的基于HMM(IliddenMarkovModels,隐马尔可夫模型)的语种识别。主要包括:为了使效率更高,课差更少,把音频的首尾两端无用的静音段进行切除(VAD);分帧处理,把声音分开成不同的段,每段称为一帧;波形变换,传统的方法是提取音频信号的MFCC(MelFrequencyCepstralCoefficients,梅尔频率倒谱系数)特征,一帧迫性就可以使用12维的向量进行描述;比对数据库,得岀语种信息。(2)基

7、于音素识别器的语种识别方法。主要包括:通过音素识别器将语音信号转换为音素序列;根据音素序列提取N-gram单元统计量作为特征;根据这些统计特性建立每个语种的N-Gram语言模型;比对后,得出语种。4语种识别实验4.1Langid(语言标识)工具包及内容仃)LangidI具简介。Langid作为一个应用非常广泛的语音识别工具,可用于因特网信息,网络搜索词,文木检索,语法分析等多个领域。langid.py可以看作是一个全监督分类器,主要基于多项式的朴素贝叶斯分类器,包含97种语言,并对每种语言场景进行模型训练。(2)Langi

8、dI具优点。主要包括:能够直接使用,而且不同于传统文本识别工具;多种文本场景都可以适用于该模型;代码部署简单;执行速度快;可作为网络服务;与WSGI兼容,可以部署在WSGI服务器上,从而实现并行操作。4.2langid语种识别原理(1)确定目标函数。使用Langid进行语种分类,目的是对于一篇包含n个特

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。