胡欢水文献综述

胡欢水文献综述

ID:42697307

大小:61.00 KB

页数:4页

时间:2019-09-20

胡欢水文献综述_第1页
胡欢水文献综述_第2页
胡欢水文献综述_第3页
胡欢水文献综述_第4页
资源描述:

《胡欢水文献综述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、附件1:文献综述语音合成技术专业班级:电子本083姓名:胡欢水学号:08010402摘要:随着社会的发展和科学技术的进步,人类已跨入信息时代,人们在不断寻求灵活、方便、快捷的信息交换方式。而语音是众多信息载体中具有最大信息容量、最高智能水平的信号之一,作为信息交换的一种方式——语音具有其独特的优越性。语音合成技术是新一代智能计算机的一项重要标志,是计算机智能接口的重要组成部分。它能为我们提供基于自然语言的人机通讯方式,大大改善人机界面,与语音识别相结合,就能达到人机对话的目的。本文对语音合成,语音合成技术的方

2、法和TTS的基本结构进行了介绍,列举了一些语音合成技术在生活中的实际应用,并对语音合成技术进行了展望。关键词:语音合成技术;语音合成一语音合成简介语音合成,又称文语转换(texttospeech)技术,它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,解决的主要问题就是如何将文字信息转化为可听的声音信息[。传统的声音回放设备(系统),是通过预先录制声音然后回放来实现“让机器说话”的。这种方式无论是在内容、存储、传输或者方便性、及时性等方面都存在很大的限制。而通过计算机语音合成则可以在任何时候将任意文

3、本转换成具有高自然度的语音,从而真正实现让机器“像人一样开口说话”。一个语音合成系统。按其合成方式主要分为有限词汇和无限词汇的合成,按其使用目的和约束条件等可分为各种合成方法,最简单的是录音编辑方式,其次是波形编码方式,再次是参数编码方式,最后是按规则合成方式[1]。二语音合成技术的方法语音合成技术可分为参数合成和波形拼接两种方法。早期的研究主要是采用参数合成方法,它是计算发音器官的参数,能对人的发音进行直接模拟。由于准确提取共振峰参数比较困难,虽然利用共振峰合成器可以得到许多逼真的合成语音,但是整体合成语音

4、的音质难以达到文语转换系统的实用要求。因此后来又产生了基于LPC、ISP等声学参数的合成系统。自八十年代末期至今,语言合成技术又有了新的进展,特别是基音同步叠加(PSOLA)方法的提出,使基于时域波形拼接方法合成的语音的音色和自然度大大提高。九十年代初,基于PSOLA技术的法语、德语、英语、日语等语种的文语转换系统都已经研制成功。这些系统的自然度比以前基于LPC方法或共振峰合成器的文语合成系统的自然度要高。在文献[2]中,作者认为目前的语音合成技术主要是基于共振峰的参数合成技术和基于PSOLA算法的波形拼接合

5、成技术。这两种技术各有所长,共振峰技术比较成熟,有大量的研究成果可以利用,而PSOLA技术则是比较新的技术,具有良好的发展前景。三语音合成技术的缺陷在文献[3][4]作者认为语音合成技术发展至今,存在着一些缺点,主要体现在以下方面:①与可懂度直接相关的发音质量,包括音质缺陷、多音字、轻声、变调、数字串等方面的问题。②与自然度密切相关的“分词断句”错误,反映了韵律结构预测方面的问题。③合成语音音色单一、语调缺少变化、缺乏表现能力,直接原因是由于系统中没有轻重音、功能语调、发音风格等方面的控制。这些问题的存在表明

6、:目前的语音合成技术还处在“表音”层次,而且在这一层次系统性能还有提升的空间;另外,系统还不具备属于更高层次的“表情达意”的能力,还不能通过合成语音准确、生动地传递语义信息[5]。四TTS的基本结构在文献[6][7][8]中作者将TTS的基本结构分为语言学处理、韵律处理和声学处理三大模块,并对三大模块进行了介绍。其基本工作原理是:事先将全部的汉语音节进行录音,形成音频数据,以音库的形式存放在计算机的磁盘上,以供调用。然后用键盘、光电扫描等输人手段,形成ASCII文本文件(最新的系统也允许为WORD文件、INT

7、ERNET文档)。系统运行时,先将ASCII文本文件进行语言学处理、韵律处理,得到语流控制参数。然后读取音库,从音库中得到对应的音频数据,再经声学处理形成连续的语声流,即完成了从文本到语音的转换过程。其结构如图1所示:图1TTS的基本结构图4.1语言学处理语言学处理在文语转换系统中起着重要的作用,主要模拟人对自然语言的理解过程,使计算机对输入的文本能完全理解并给出后两部分所需的各种发音提示。其工作过程可以分为三个主要步骤:(1)文本规整将输入的文本规范化。在这个过程中,要查找拼写错误,并将文本中出现的一些不规

8、范或无法发音的字符过滤掉。(2)词的切分分析文本中词或短语的边界,确定文字的读音,同时分析文本中出现的数字、姓氏、特殊字符、专有词语以及各种多音字的读音方式。(3)语法分析和语义分析根据文本的结构、组成和不同位置上出现的标点符号,确定语气的变换以及不同音的轻重方式。最终,文本分析模块将输入的文字转换成计算机能够处理的内部参数,便于后续模块进一步处理并生成相应的信息。4.2韵律处理为合成语音规划出音段

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。