视频编码标准的发展:从H.261到H.264( 三 )


H.264基本部分的帧内猜测包括9种4×4亮度块的猜测、4种16×16亮度块的猜测和4种色度块的猜测 。
运动估计
H.264的运动估计具有3个新的特点:1/4象素精度的运动估计;7种大小不同的块进行匹配;前向与后向多参考帧 。
H.264在帧间编码中,一个宏块(16×16)可以被分为16×8、8×16、8×8的块,而8×8的块被称为子宏块,又可以分为8×4、4×8、4×4的块 。总体而言,共有7种大小不同的块做运动估计,以找出最匹配的类型 。与以往标准的P帧、B帧不同,H.264采用了前向与后向多个参考帧的猜测 。半象素精度的运动估计比整象素运动估计有效地提高了压缩比,而1/4象素精度的运动估计可带来更好的压缩效果 。
编码器中运用多种大小不同的块进行运动估计,可节省15%以上的比特率(相对于16×16的块) 。运用1/4象素精度的运动估计,可以节省20%的码率(相对于整象素猜测) 。多参考帧猜测方面,假设为5个参考帧猜测,相对于一个参考帧,可降低5%~10%的码率 。以上百分比都是统计数据,不同视频因其细节特征与运动情况而有所差异 。
熵编码
H.264标准采用的熵编码有两种:一种是基于内容的自适应变长编码(CAVLC)与统一的变长编码(UVLC)结合;另一种是基于内容的自适应二进制算术编码(CABAC) 。CAVLC与CABAC根据相临块的情况进行当前块的编码,以达到更好的编码效率 。CABAC比CAVLC压缩效率高,但要复杂一些 。
去块效应滤波器
H.264标准引入了去块效应滤波器,对块的边界进行滤波,滤波强度与块的编码模式、运动矢量及块的系数有关 。去块效应滤波器在提高压缩效率的同时,改善了图像的主观效果 。
其他视频编码标准
除上述ITU-T的视频压缩标准外,还有一些标准也比较流行,如MPEG-4、AVS、WM9 。
H.264也称为MPEG-4 AVC,而目前业内所说的MPEG-4一般是指SP(简级)或ASP(先进的简级),主要针对低码率应用,如因特网上的流媒体、无线网的视频传输及视频存储等,其核心类似于H.263 。
MPEG-4 SP和H.263有很多相似的地方,如附表所示 。然而,这两个标准之间也有显著的不同,主要表现在:码流结构和头信息、熵编码的部分码表、编码技术的一些细节 。MPEG-4 ASP较SP增加了一些技术,主要有:1/4象素精度的运动估计、B帧、全局运动矢量(GMV),因而压缩效率得以提高 。

AVS是由我国自主制定的音/视频编码技术标准,主要面向高清楚度电视、高密度光存储媒体等应用 。AVS标准以当前国际上最先进的MPEG-4 AVC/H.264框架为基础,强调自主知识产权,同时充分考虑了实现的复杂度 。相对于H.264,AVS的主要特点有:(1)8×8的整数变换与64级量化;(2)亮度和色度帧内猜测都是以8×8块为单位,亮度块采用5种猜测模式,色度块采用4种猜测模式;(3)采用16×16、16×8、8×16和8×8 4种块模式进行运动补偿;(4)在1/4象素运动估计方面,采用不同的四抽头滤波器进行半象素插值和1/4象素插值;(5)P帧可以利用最多2帧的前向参考帧,而B帧采用前后各一个参考帧 。
Window Meida 9(WM9)是微软公司开发的新一代数字媒体技术 。一些测试表明,WM9的视频压缩效率比MPEG-2、MPEG-4 SP及H.263高很多,而与H.264的压缩效率相当 。
结束语
目前,H.261与H.263在视频通信中广泛应用,成熟的产品已经很多 。H.263与H.261相比,增加了若干选项,提供了更灵活的编码方式,压缩效率大大提高,更适应网络传输 。H.264标准的推出,是视频编码标准的一次重要进步,它与现有的MPEG-2、MPEG-4 SP及H.263相比,具有明显的优越性,非凡是在编码效率上的提高,使之能用于许多新的领域 。尽管H.264的算法复杂度是现有编码压缩标准的4倍以上,随着集成电路技术的快速发展,H.264的应用将成为现实 。(本文作者郭晓强先生,北京邮电大学博士生;门爱东先生,电信学院多媒体通信中心教授、博士生导师)

推荐阅读