语音信号的时域分析

语音信号的时域分析

ID:37966132

大小:3.04 MB

页数:46页

时间:2019-06-04

语音信号的时域分析_第1页
语音信号的时域分析_第2页
语音信号的时域分析_第3页
语音信号的时域分析_第4页
语音信号的时域分析_第5页
资源描述:

《语音信号的时域分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第4章 语音信号的时域分析4.2语音信号的数字化与预处理4.1概述4.4短时平均过零率和上升过零间隔4.3短时平均能量和短时平均幅度4.5短时自相关函数和短时平均幅度差函数4.6短时时域处理技术的应用4.7中值滤波在语音短时时域处理中的应用第4章 语音信号的时域分析4.1概述语音信号携带各种信息:男声、女声,喜、怒,中、英等。不同场合感兴趣的信息不同;◆判断信号是否为语音,只需人类语音信号的一般特征;◆区分语音为清、浊音,需语音能量谱和基频;◆数字传输或数字存储时,目的不同,保留信息精度不同;语音信号处理的任务:◆去除与应用目的不相干或影响不大的语音信息◆需要的信息不

2、仅应当提取出来,有时还需要加强。以上涉及语音信号中,各种信息的表示问题。表示方法的原则:最方便、最有效。短时分析技术贯穿于语音分析的全过程。第4章语音信号的时域分析4.1概述整体的语音信号来讲,分析出的是由每一帧特征参数组成的特征参数时间序列。语音信号分析:时域分析、频域分析、倒频域分析等;语音信号分析:模型分析、非模型分析;模型分析法是指依据语音信号产生的数学模型,来分析和提取表征这些模型的特征参数,◆模型分析:共振峰分析、无损级联声管分析法◆非模型分析:不进行模型化的分析语音的预处理:语音信号的数字化、语音信号的端点检测、预加重、加窗、分帧等,本章重点:语音信号的

3、各种时域分析技术,是语音处理技术的基础知识。第4章语音信号的时域分析4.1概述第4章 语音信号的时域分析4.2语音信号的数字化和预处理信号数字化:放大、增益控制、反混叠滤波、取样、A/D变换及编码(PCM编码);预处理:预加重、加窗、分帧、端点检测等;图4.1:语音信号数字分析或处理的系统框图。第4章语音信号的时域分析4.2语音信号的数字化和预处理图4.1语音信号数字处理系统框图反混叠滤波语音输入语音输出A/D转换分析处理平滑滤波D/A转换合成处理传输或存储4.2.1预滤波、取样、A/D变换预滤波:带通滤波器(上、下截止频率为fH、fL)◆防混叠滤波,抑制>fs/2的

4、输入信号分量(fs为取样频率)◆抑制工频干扰(50Hz电源)。多数语音编/译码器:fH=3.4kHz,fL=60~100Hz,fs=8kHz。语音识别:◆对电话用户指标与语音编/译码器时相同;◆要求较高或很高:fH=4.5or8kHz,fL=60Hz,fs=10or20kHz。A/D变换需对信号量化,编码为二进制,产生量化误差。量化误差(量化噪声):量化信号值与原信号值之差;信号波形的变化足够大或量化间隔足够小时,量化噪声符合具有下列特征的统计模型:①量化噪声是平稳的白噪声过程;②量化噪声与输入信号不相关;③量化噪声在量化间隔内均匀分布,即具有等概率密度分布。第4章语

5、音信号的时域分析4.2语音信号的数字化和预处理量化信噪比SNR(信号与量化噪声的功率比)为:式中,——输入语音信号序列的方差,——噪声序列的方差,——信号的峰-峰值,B——量化字长,设语音信号的幅度服从Laplace分布,则取,上式改写为:B=7bit,SNR=35dB,能满足一般通信系统的要求。语音波形的动态范围达55dB,故B应取10bit以上。为保持35dB的信噪比,常用12bit量化,附加的5bit用于补偿30dB左右的输入动态的变化。表明量化器中每bit字长对SNR的贡献约为6dB第4章语音信号的时域分析4.2语音信号的数字化和预处理A/D变换器:分为线性和

6、非线性两类。目前采用绝大部分的线性A/D变换器是12bit。非线性A/D变换器一般是8bit,它与12bit线性变换器等效。有时需要将非线性的8bit码转换为线性的12bit码。数字化的反过程是从数字化语音中重构语音波形。必须在D/A后加平滑滤波器,对重构的语音波形的高次谐波起平滑作用,以去除高次谐波失真。预滤波、取样、A/D和D/A变换、平滑滤波等许多功能可以用一块芯片完成,在市场上有多种这样的集成芯片供选用。第4章语音信号的时域分析4.2语音信号的数字化和预处理4.2.2预处理预处理:预加重、加窗、分帧、端点检测等;语音的一个特征:约8kHz高频端按-6dB/倍频

7、程跌落。预加重:提升语音的高频部分,使信号的频谱变得平坦,◆可在反混叠滤波前,可压缩动态范围,提高信噪比。◆也可在数字化后、参数分析之前。预加重用6dB/倍频程的提升高频特性的预加重数字滤波器:式中,μ为常系数,值接近于1,通常取μ=0.92~0.94。恢复原信号,对测量值进行去加重处理,即加上-6dB/倍频程的下降的频率特性来还原成原来的特性。第4章语音信号的时域分析4.2语音信号的数字化和预处理4.2.3窗函数的作用采用连续分段或交叠分段的方法分帧,33~100帧/秒。图4.2:帧移与帧长示例。帧与帧之间的信号平滑过渡,保持其连续性。帧移:前后帧

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。