视频编码标准的发展:从H.261到H.264( 二 )


为适应网络传输,H.263 增加了时间分级、信噪比和空间分级,对在噪声信道和存在大量包丢失的网络中传送视频信号很有意义;另外,片结构模式、参考帧选择模式增强了视频传输的抗误码能力 。
H.263视频压缩标准
H263在H263 基础上增加了3个选项,主要是为了增强码流在恶劣信道上的抗误码性能,同时为了提高增强编码效率 。这3个选项为:
选项U——称为增强型参考帧选择,它能够提供增强的编码效率和信道错误再生能力(非凡是在包丢失的情形下),需要设计多缓冲区用于存贮多参考帧图像 。
选项V——称为数据分片,它能够提供增强型的抗误码能力(非凡是在传输过程中本地数据被破坏的情况下),通过分离视频码流中DCT的系数头和运动矢量数据,采用可逆编码方式保护运动矢量 。
选项W——在H263 的码流中增加补充信息,保证增强型的反向兼容性,附加信息包括:指示采用的定点IDCT、图像信息和信息类型、任意的二进制数据、文本、重复的图像头、交替的场指示、稀疏的参考帧识别 。H.264视频编码标准
H.264是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一代视频压缩编码标准 。事实上,H.264标准的开展可以追溯到8年前 。1996年制定H.263标准后,ITU-T的视频编码专家组(VCEG)开始了两个方面的研究:一个是短期研究计划,在H.263基础上增加选项(之后产生了H.263 与H.263);另一个是长期研究计划,制定一种新标准以支持低码率的视频通信 。长期研究计划产生了H.26L标准草案,在压缩效率方面与先期的ITU-T视频压缩标准相比,具有明显的优越性 。2001年,ISO的MPEG组织熟悉到H.26L潜在的优势,随后ISO与ITU开始组建包括来自ISO/IEC MPEG与ITU-T VCEG的联合视频组(JVT),JVT的主要任务就是将H.26L草案发展为一个国际性标准 。于是,在ISO/IEC中该标准命名为AVC(Advanced Video Coding),作为MPEG-4标准的第10个选项;在ITU-T中正式命名为H.264标准 。H.264的主要优点如下:


在相同的重建图像质量下,H.264比H.263 和MPEG-4(SP)减小50%码率 。
对信道时延的适应性较强,既可工作于低时延模式以满足实时业务,如会议电视等;又可工作于无时延限制的场合,如视频存储等 。
提高网络适应性,采用“网络友好”的结构和语法,加强对误码和丢包的处理,提高解码器的差错恢复能力 。
在编/解码器中采用复杂度可分级设计,在图像质量和编码处理之间可分级,以适应不同复杂度的应用 。
相对于先期的视频压缩标准,H.264引入了很多先进的技术,包括4×4整数变换、空域内的帧内猜测、1/4象素精度的运动估计、多参考帧与多种大小块的帧间猜测技术等 。新技术带来了较高的压缩比,同时大大提高了算法的复杂度 。
4×4整数变换
以前的标准,如H.263或MPEG-4,都是采用8x8的DCT变换 。H.26L中建议的整数变换实际上接近于4×4的DCT变换,整数的引入降低了算法的复杂度,也避免了反变换的失配问题,4×4的块可以减小块效应 。而H.264的4×4整数变换进一步降低了算法的复杂度,相比H.26L中建议的整数变换,对于9b输入残差数据,由以前的32b降为现在的16b运算,而且整个变换无乘法,只需加法和一些移位运算 。新的变换对编码的性能几乎没有影响,而且实际编码略好一些 。
基于空域的帧内猜测技术
视频编码是通过去除图像的空间与时间相关性来达到压缩的目的 。空间相关性通过有效的变换来去除,如DCT变换、H.264的整数变换;时间相关性则通过帧间猜测来去除 。这里所说的变换去除空间相关性,仅仅局限在所变换的块内,如8×8或者4×4,并没有块与块之间的处理 。H.263 与MPEG-4引入了帧内猜测技术,在变换域中根据相临块对当前块的某些系数做猜测 。H.264则是在空域中,利用当前块的相临象素直接对每个系数做猜测,更有效地去除相临块之间的相关性,极大地提高了帧内编码的效率 。

推荐阅读