一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究.pdf

一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究.pdf

ID:58295429

大小:238.93 KB

页数:6页

时间:2020-04-30

一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究.pdf_第1页
一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究.pdf_第2页
一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究.pdf_第3页
一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究.pdf_第4页
一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究.pdf_第5页
资源描述:

《一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第10期电子学报VoI.33No.102005年10月ACTAELECTRONICASINICAOct.2005一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究王守觉1,2,潘晓霞2,徐春燕2,陈旭1,安冬1,曹文明2(1.中国科学院半导体研究所,北京100083;2.浙江工业大学智能信息系统研究所,浙江杭州310014)摘要:本文使用高维空间点分布分析原理,在仿生模式识别高维空间点覆盖原理的基础上,提出了一种基于高维空间点覆盖动态搜索理论的非特定人连续数字语音识别的新算法,这种算法可以不经过端点检测和分割,通过对被识别连续数字语音直接进行动态搜索,得到被识别语音到各类高维

2、空间覆盖范围的距离随时间变化曲线,通过距离曲线上的极小值点进行识别.关键词:连续语音识别;高维空间点覆盖;非特定人语音识别中图分类号:TN912.34文献标识码:A文章编号:0372-2112(2005)10-1790-04ResearchonSpeaker-lndependentContinuousFigureSpeech-RecognitionBasedonHigh-dimensionalSpaceCoveringanddynamicScanning1,2,PANXiao-xia2,XUChun-yan2,CHENXu1,ANDong1,CAOWen-ming2WANGShou-jue

3、(1.LabofArtificialNeuralNetworks,InstituteofSemiconductors,CAS,Beijing100083,China;2.ResearchInstituteofIntelligentInformationSystem,ZhejiangUniuersityofTechnology,Hangzhou,Zhejiang310014,China)Abstract:ThroughanaIyzingsampIesdistributioninhighdimensionaIspace,anoveIaIgorithmforspeaker-independent

4、contin-uousfigurespeechrecognitionispresentedbasedonhigh-dimensionaIspacecovering,biomimeticpatternrecognitionanddynamicscanninginthispaper.Withoutendpointsdetectionandsegmentingthecontinuousspeechisdynamicscanned,thendistancecurvesfromthecontinuousspeechtoeverykindofcoveringareainhighdimensionaIs

5、paceareobtained.ThecontinuousspeechisrecognizedbydetectingtheminimumvaIuesinthecurves.Keywords:continuousspeechrecognition;high-dimensionaIspacecovering;speakerindependent别,从而降低识别的难度.!引言HMM模型是目前最流行的方法,它将语音识别系统的训目前小词汇表非特定人的孤立词识别系统已经实用化,练模型分成声学模型和语言模型.声学模型的训练采用多步但较好的实用连续语音识别系统依然很少,因此20世纪90训练的方法;语言模型

6、的训练是通过对大量的语料进行统计年代以来,语音识别研究主要集中在提高非特定人的大词汇而实现的.因此系统的识别算法要根据语言的特点和统计模量连续语音识别(LargeVocabuIaryContinuousSpeechRecogni-型的整体结构进行设计,然后按照一定的搜索规则(深度优先[1][3]tion,简写为LVCSR)的性能上.非特定人的连续数字语音识或宽度优先)进行解码.对于孤立词或语速较慢的语音而[4]别算法的研究,不但可以作为非特定人大词汇量的连续语音言,可以得到比较高的识别率,而且技术也已比较成熟.识别新算法的探讨;而且有非常可观的应用价值,比如声控电然而对于语速不定,环境不定

7、的类似自然口音语音的连话交换、语音拨号系统、电话查询系统、自动应答服务、数字报续语音而言,这种方法的识别效果就很不理想了,这是因为这表等等.种算法在本质上还是将特征空间划分为几个状态,识别结果传统的语音识别算法是先将语音通过自动切分机切分成在这几个状态之间进行比较、转移、搜索,而不是像仿生模式[5]语音段,再对切分出来的固定的语音段,采用隐马尔可夫的统识别的先认识再区别,因此,由于过分的依赖语音的端点检[2]计模型(Hi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。