多媒体技术音频编码基础和标准

多媒体技术音频编码基础和标准

ID:39472653

大小:478.50 KB

页数:29页

时间:2019-07-04

多媒体技术音频编码基础和标准_第1页
多媒体技术音频编码基础和标准_第2页
多媒体技术音频编码基础和标准_第3页
多媒体技术音频编码基础和标准_第4页
多媒体技术音频编码基础和标准_第5页
资源描述:

《多媒体技术音频编码基础和标准》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、2.3音频编码基础和标准2.3.1音频编码基础2.3.2音频编码标准2.3.1音频编码基础一、压缩编码的必要性二、音频编码基础三、音频编码的分类压缩编码的必要性多媒体音频数据的存储和传输中,必须压缩数据。利用音频编码压缩数据。高质量音频采样数据率(每秒比特数):信号类型频率范围(HZ)采样率(KHZ)量化精度(位)数据率(位/秒)电话话音200~34008864k高质量音频20~20K44.116705.6k压缩编码数据率:信号类型数据率(位/秒)压缩编码标准数据率(位/秒)数据率(字节/分钟)I

2、P电话话音64kG.7235.3k40K705.6k44.1128k960k3压缩编码的必要性数据压缩造成音频质量的下降、计算量的增加。人们在实施数据压缩时,要在音频质量、数据量、计算复杂度三方面进行综合考虑。各领域的专家致力于算法的研究,众多的企业致力于芯片和产品的研制,国际标准化组织也先后推出一系列建议。高质量高效率的音频压缩技术广泛地用于多媒体应用、音像制品、数字广播、数字电视等领域。4音频编码基础从信息保持的角度讲,只有当信源本身具有冗余度,才能对其进行压缩。根据统计分析结果,语音信号存在

3、着多种冗余度,其最主要部分可以分别从时域和频域来考虑。另外由于语音主要是给人听的,所以考虑了人的听觉机理,也能对语音信号实行压缩。1、时域信息的冗余度2、频域信息的冗余度3、人的听觉感知机理51、时域信息的冗余度幅度的非均匀分布 一般语音中小幅度样本比大幅度样本出现的概率要高,并且通话中必然会有间隙,更会出现大量低电平样本。因此.语音信号取样值的幅度分布是非均匀的,可以采用非均匀量化对其编码。样本间的相关 对语音波形的分析表明,取样数据的最大相关性存在于邻近样本之间,并且取样速率越高,样本间相关性

4、越强。根据相关性,可利用N阶差分编码技术,进行有效的数据压缩。61、时域信息的冗余度(续)周期之间的相关 虽然语音信号需要一个电话通路提供整个200~3400HZ的带宽,但在特定的瞬间,某声音只有少数频率成分在作用,它们在周期域周期间,存在着一定的相关性。基音之间的相关 人说话声音分为浊音和清音,浊音不仅有周期间的冗余度,还对应于音调间隔的长期重复波形。71、时域信息的冗余度(续)静音系数 两人间打电话,平均每人的讲话时间为通话总时间的一半,另一半时间听对方讲。听的时候—般不讲活,而即使是在讲话的

5、时候,也会出现停顿。声音间隔本身就是一种冗余,若能正确检测出该静比段,便可“插空”传输更多的信息。长时自相关函数 上述周期间等相关性,都是在20ms间隔内进行统计的所谓短时自相关。如果在较长的时问间隔(如几十秒)进行统计,便得到长时自相关函数。82、频域信息的冗余度非均匀的长时功率谱密度 在相当长的时间间隔内进行统计平均,可得到长时功率谱密度函数.其功率谱呈现强烈的非平坦性。从统计的观点看,这意味着没有充分利用结定的频段,有固有的冗余度语音特有的短时功率谱密度 语音信号的短时功率谱,在某些频率上出

6、现峰值,这些峰值频率不只一个,但最主要的是第一和第二个,由它们决定不同的语音特征。93、人的听觉感知机理人的听觉具有掩蔽效应 当两个响度不同的声音作用于人耳时,响度较高的频率成分会影响对响度较低频率成分的感受。人耳对不同频段的声音敏感度不同 低频成分容易掩蔽高频成分。即使是对同样声压级的声音,人耳的实际感觉到的音量也是随频率而变化。人耳对语音信号的相位变化不敏感 入耳听不到或感知极不灵敏的声音分量都不妨视为冗余的。10音频编码的分类音频编码分位三类:基于音频数据的统计特性进行编码,其典型技术是波形

7、编码。其目标是使重建语音波形保持原波形的形状;基于音频的声学参数,进行参数编码,可进一步降低数据率。其目标是使重建音频保持原音频的特性;基于人的听觉特性,进行感知编码。11音频编码的分类(续)波形编码:脉冲编码调制(PCM)自适应脉冲编码调制(APCM)差值脉冲编码调制(DPCM)自适应差值脉冲编码调制(ADPCM)参数编码:预测方式:前向/后向,短时/长时参数类型:LPC,LSP,CEP激励方法:编码策略:合成-分析法感知编码---MPEG,AC-3122.3.2音频编码标准当前编码技术发展的一

8、个重要的方向就是综合现有的编码技术,制定全球的统一标准,使信息管理系统具有普遍的互操作性并确保了未来的兼容性。国际上,对于语音信号压缩编码的审议在CCITT下设的第十五研究组进行,相应的建议为G系列,多由ITU发表。13CCITT和ISO先后提出一系列有关音频编码的建议,推荐的标准:1972年:G.711---64kb/sPCM编码标准。1984年:G.721---32kb/s自适应差值脉冲编码(ADPCM)G.722---64kb/s子带ADPCM编码标准G.723.1---5.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。