语音信号传输的理论

语音信号传输的理论

ID:38308369

大小:560.31 KB

页数:42页

时间:2019-06-09

语音信号传输的理论_第1页
语音信号传输的理论_第2页
语音信号传输的理论_第3页
语音信号传输的理论_第4页
语音信号传输的理论_第5页
资源描述:

《语音信号传输的理论》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、语音信号数字处理张力参考数目:《语音信号数字处理》杨行峻《语音信号处理》易克初绪论数字语音处理的概念语音的基本特征数字语音处理的发展课程内容以及安排前言耳聪目明听说读写语音和图像——重要的感知媒体对语音和图像的分析处理 ——媒体计算的主要研究对象和内容语音:新一代自然人机交互的关键之一信号处理——模式识别——人工智能语音信号处理的概念语音信号处理简称语音处理,是以语音学和数字信号处理为基础而形成的一门综合性学科,处理的目的是要得到一些语音参数以便高效的传输或存储,或者通过处理的某种运算以达到某种用途

2、的要求,例如人工合成出语音,辨识出说话者,识别讲话的内容等。它包括语音编码、语音合成、语音识别和说话人识别四大分支。语音的定义语音是人类发音器官发出的、具有一定意义的、能起社会交际作用的声音。能够代表一定的意义,这是语言的声音同自然界其他一切声音的本质区别。人体外的声音自不必说(如钟声、风声、动物叫声、机器声),就是人的发音器官发出的声音,也并非都是语言。如打喷嚏、打嗝儿、打哈欠、咳嗽等等,虽然也传递出了某种信息─病了,饱了,困了或是醒了,但声音的发出不是为了交际,而是人体本能的生理反映;又如吹口哨

3、、口技演员的表演、哭、笑等等,这些声音的发出是有目的的,是一定的心理活动的表现,不是单纯的生理现象,但声音同意义之间没有固定的结合关系,不能成为代表意义的声音符号,只能表示情绪,展示技巧。以上这些声音都不是语言。语音的定义语言的声音同它所代表的意义是相互依存的统一体,一方面,发音器官发出的声音必须同意义紧密结合、成为一定意义的代表,才能成为语音;另一方面,意义必须借助声音才能成为可被人感知、被人接受的东西,没有声音,意义便无法表达出来。语音是一种具有多重属性的声音。首先,它同自然界其他声音一样,是由

4、物体振动产生声波而形成的一种自然现象,所以它具有物理的属性方面的自然属性。语言又是人类的生理现象,发音是人体器官的动作。因此,它同时具有生理属性。作为语言这一特殊社会现象的物质基础,语音又具有社会属性,这是语音的本质属性。我们在分析语音现象的时候,这三种属性都会涉及到。语音学语音学是研究语音过程的科学,包括发音语音学、声学语音学和听觉语音学三大分支。发音语音学研究发音器官在发音过程中的运动和语音的音位特征;声学语音学研究语音的物理属性,如语音声波的频率、振幅以及频谱特性等;听觉语音学研究听觉和语音感

5、知。语音的属性—物理属性物体由于某种外力的作用发生振动,并引起周围空气或其他媒介物质的振动,产生了振动波─声波,声波作用于耳鼓膜,使之产生同样的振动,刺激听觉神经,人就感觉到了声音。语音也是这样产生、传递与接收的。物理声学认为声波具有音高、音强、音长、音色四种要素,语音同样是这四种要素的统一体。声波示意(L.A.Rowe)压缩稀薄时间幅度正弦波声波频率声压变化可以是周期性的和非周期性频率概念循环(cycle)-压缩/稀薄过程频率(frequency):每秒cycle数,单位hertz(Hz)周期–c

6、ycle的持续时间(1/frequency)声音信号一般由许多频率不同的信号组成,称为复合信号;而单一频率的信号称为分量信号频率范围频率小于20Hz一般称为次声波(subsonic)人的听觉器官能感知的声音频率范围约为20Hz~20kHz的信号称为音频(Audio)信号人发音器官发声频率约是80~3400Hz,但人说话的信号频率约为300~3000Hz,即话音(speech)信号高于20kHz的信号称为超声波(ultrasonic)超声波及次声波一般不能引起人听觉器官的感觉,但可借助一些仪器设备进行

7、观察和测量语音的物理属性—音高音高指声音的高低,它取决于发音体振动的快慢。发音体振动越快,发出的声音越高,反之声音则低。物体每秒钟振动的次数叫频率,声学把频率作为测定物体振动快慢与声音高低的标准。说声音的频率高就是说发音体在单位时间里振动次数多,它振动得快,发出的声音高,而频率低也就表示声音低。频率的高低是由物体自身的质量、松紧度、长短等项因素决定的,大而沉、粗而厚、长而松的物体振动慢,音低;小而轻、细而薄、短而紧的物体振动快,音高。语音的高低则与声带的长短、厚薄、松紧有关。通常,儿童和一般妇女的声

8、带比成年男子的声带短而薄,所以声音高;而声音低的人声带相对说长而厚,如成年男子,女中、低音声乐演员,老人等。同一个人发出的声音有高低变化,则是靠控制声带的松紧来调节的。典型声门脉冲波形Tp为基音周期,倒数为基音频率,用fp表示,取决于声带的尺寸和特性男性说话者的fp大致分布在60-200Hz范围内女性说话者和小孩的fp值在200-450Hz范围内同一个人所发出的声音有高低变化,是靠控制声带的松紧来调节的。语音的物理属性—音强音强是指声音的强弱,它取决于发音体振动幅度的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。