基于纹理特征的视频编码技术研究

基于纹理特征的视频编码技术研究

ID:33582075

大小:1.14 MB

页数:61页

时间:2019-02-27

基于纹理特征的视频编码技术研究_第1页
基于纹理特征的视频编码技术研究_第2页
基于纹理特征的视频编码技术研究_第3页
基于纹理特征的视频编码技术研究_第4页
基于纹理特征的视频编码技术研究_第5页
资源描述:

《基于纹理特征的视频编码技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、哈尔滨工业大学工学硕士学位论文第1章绪论1.1课题研究的背景和意义随着数字信号处理技术、网络技术以及超大规模集成电路技术突飞猛进的发展,多媒体通信成为研究和应用的热点。其中,视频手机、高清数字电视、视频会议等数字视频通信产品正迅速的进入办公室和普通家庭中,其覆盖领域已触及到通信、多媒体、广播电视和计算机等各个角落,其应用范围渗透到从低端到高端不同的视频通讯应用。数字视频是由数字图像的时间序列构成的,每一幅这样的图像称为一帧(frame)。对于视频序列来说,帧速率就是时间序列的播放速率,通常的帧速率在25-30fps(帧/

2、秒)之间,如果低于此帧速率,人眼就会感到画面出现延时。原始数字视频数据庞大,以普通电视的格式(CIF,commonintermediateformat)为例,假定1秒的数字视频的帧速率为30fps,它的每幅图像由288行组成,每行有352个像素点,每个像素采用24个比特来存放亮度和色度分量,则每秒钟CIF数字视频中的比特数约为72.99Mb。可见,数据量巨大。这样的数据量,以今天的技术或在不久将来可采用的硬件而言,都是不可接受的。然而,视频数据具有很大的相关性,无论是相邻两帧之间还是在同一帧内相邻两个像[1]素之间,同时

3、人眼可以容忍一定的误差,这就为视频压缩提供了可能。因此视频在传输之前必须进行压缩,从而在保证一定重构质量的前提下,以尽量少的比特数来表达视频信息。压缩的过程涉及两个互相关联的完整系统,即压缩器(编码器)和解压缩器(解码器)。在传输和存储前,编码器先将原始的视频数据转换为压缩的格式,一对编码器和解码器通常被称作编解码器CODEC。数据的压缩是通过去除冗余实现的,冗余可以看作在完整恢复数据时不必要的信息。大多数视频编码方法通过同时减小时间和空间上的冗余来实现压缩。在时域,时间上相邻的视频帧之间通常会有很强的相关性,特别是当时

4、域的采样频率非常高时,这种相关性更强;在空间域,位置相邻的像素也存在很强的互相关性。通常,视频编码器(Encoder)由三个主要单元组成:时域模块、[2]空域模块和熵编码器,如图1-1所示,时域模块的输入数据为没有被压缩的视频序列。利用视频图像时间上的相似性,时域模块通常采用帧间预测的方法减少时域的冗余度。时域模块的输出为残差图像和运动矢量,用于运动补偿和图-1-哈尔滨工业大学工学硕士学位论文像的重建。空域模块的输入就是残差图像,该模块利用残差图像中相邻点之间的相似性实现对空域冗余的压缩。在当前的编码标准中,通常采用变换

5、和量化实现该模块的功能。变换是将残差信号转换到另一个域,再通过量化去除变换域一些不重要的系数,只保留小部分非常重要的系数。空域模块的输出数据即为量化后的变换系数。第三个单元——熵编码器是用来压缩前两个模块输出数据的统计冗余。压缩的视频序列包含了编码的运动矢量、经过变换量化后的图像残差和一些头信息。视频解码器(Decoder)从视频码流中恢复出编码的变换块系数和运动矢量,再通过空域模块恢复出图像的残差数据,在时域模块恢复出运动矢量,运动矢量完成运动补偿,即从参考图像中预测出当前图像,再通过与残差图像相加,重建原始图像。图像

6、残差视频输入时域模块空域模块运动矢量块编码系数块模式参考帧熵编码编码码流输出图1-1视频编码器基本结构Figure1-1VideoEncoderStructure1.2数字视频编码的发展历程1948年Oliver提出了第一个编码理论——脉冲编码调制(PulseCodingModulation,简称PCM);同年Shannon的经典论文《通信的数学原理》中首次[3]提出并建立了信息率失真函数概念;1959年Shannon进一步确立了码率失真理论。以上工作奠定了经典信息编码的理论基础,在此基础上视频编码理论和技术取得了长足的

7、发展。其主要的编码方法有:预测编码、变换编码和统计编码,也称为三大经典编码方法。其中预测编码的基本思想是:根据数据的统计特性得到预测值,然后传输图像像素与其预测值的差值信号,使传输的码率降低,达到压缩的目的。变换编码的基本思想是:由于数字图像像素间存在高度相关性,因此可以进行某种变换来消除这种相关性。变换编码不直接对空域图像像素编码,而是先将它变换到频域,得到一组变换系数。虽然变换并不对数据进行压缩,但经过变换后能量相对集中,通过后续的量化能达到压缩的目-2-哈尔滨工业大学工学硕士学位论文的。变换编码方法中的离散余弦变换

8、(DCT)和小波变换(Wavelet)在视频和图像压缩中得到了广泛应用。统计编码的基本思想是:根据信息码字出现概率的分布特征而进行压缩编码,寻找概率与码字长度间的最优匹配。统计编码又可分为定长码和变长码(VLC),Huffman编码和算术编码是两种常见的变长码字编码方法。第一代编码技术只是以信息论和数字信号处理技术为

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。