GY/T 257.1-2012 广播电视先进音视频编解码 第1部分:视频
GY/T 257.1-2012 Advanced Audio Video Coding for Broadcasting Television - Part 1: Video
基本信息
发布历史
-
2012年07月
文前页预览
研制信息
- 起草单位:
- 中央电视台、北京大学等
- 起草人:
- 丁文华、高文 等
- 出版信息:
- 页数:130页 | 字数:- | 开本: -
内容描述
GY
中华人民共和国广播电影电视行业标准
GY/T257.1—2012
广播电视先进音视频编解码
第1部分:视频
Advancedcodingofvideoandaudioforbroadcasting—
Part1:video
2012–07–10发布2012–07–10实施
国家广播电影电视总局发布
GY/T257.1—2012
目次
前言...............................................................................III
引言................................................................................IV
1范围..............................................................................1
2规范性引用文件....................................................................1
3术语和定义........................................................................1
4缩略语............................................................................9
5约定..............................................................................9
5.1算术运算符...................................................................10
5.2逻辑运算符...................................................................10
5.3关系运算符...................................................................10
5.4位运算符.....................................................................10
5.5赋值.........................................................................11
5.6数学函数.....................................................................11
5.7结构关系.....................................................................12
5.8位流语法、解析过程和解码过程的描述方法.......................................12
6编码位流的结构...................................................................16
6.1视频序列.....................................................................16
6.2图像.........................................................................17
6.3条带.........................................................................18
6.4宏块.........................................................................19
6.588块........................................................................19
7位流的语法和语义.................................................................20
7.1语法描述.....................................................................20
7.2语义描述.....................................................................33
8解析过程.........................................................................51
8.1k阶指数哥伦布码..............................................................51
8.2ue(v)、se(v)和me(v)的解析过程................................................51
8.3ce(v)的解析过程..............................................................54
8.4ae(v)的解析过程..............................................................55
9解码过程.........................................................................69
9.1高层语法结构.................................................................69
9.2图像头解码...................................................................69
9.3条带解码.....................................................................71
9.4宏块解码.....................................................................71
9.5块解码.......................................................................81
9.6反量化.......................................................................84
9.7反变换.......................................................................87
I
GY/T257.1—2012
9.8帧内预测......................................................................88
9.9帧间预测......................................................................89
9.10重建.........................................................................98
9.11环路滤波.....................................................................99
附录A(规范性附录)伪起始码........................................................106
附录B(规范性附录)类和级..........................................................107
附录C(规范性附录)位流虚拟参考解码器..............................................112
附录D(规范性附录)基本熵编码码表..................................................117
II
GY/T257.1—2012
前言
本部分为GY/T257《广播电视先进音视频编解码》的第1部分。
本部分按照GB/T1.1-2009给出的规则起草。
本部分由全国广播电影电视标准化技术委员会(SAC/TC239)归口。
本部分起草单位:中央电视台、北京大学、国家广播电影电视总局广播科学研究院、国家广播电影
电视总局广播电视规划院、北京博雅华录视听技术研究院有限公司、广州柯维新数码科技有限公司、深
圳市海思半导体有限公司、北京大学深圳研究生院、清华大学、中国科学院计算技术研究所、浙江大学、
华为技术有限公司、上海国茂数字技术有限公司、中山大学、华中科技大学、北京工业大学。
本部分主要起草人:丁文华、高文、郭晓强、邓向冬、张伟民、黄铁军、虞露、何芸、马思伟、曾
志华、梁凡、郑萧桢、张莉、郑建铧、潘晓菲、王强、董文辉、王荣刚、林永兵、张贤国、王振宇。
III
GY/T257.1—2012
引言
本部分遵循GB/T20090.2-2006《信息技术先进音视频编码第2部分:视频》,增加了算术编码、
帧级加权量化、同极性场跳过模式编码、增强场编码等技术。
本部分的发布机构提请注意如下事实,声明符合本部分时,可能涉及到8.2、8.4、9.2、9.3、9.4.2、
9.4.5、、、9.4.9、9.4.9、9.5.1、9.5.2、9.6、9.7、、、9.11、附
录A和附录D相关的专利的使用。
本部分的发布机构对于该专利的真实性、有效性和范围无任何立场。
专利持有人已向本部分的发布机构保证,他愿意同任何申请人在合理且无歧视的条款和条件下,就
专利授权许可进行谈判。该专利持有人的声明已在本部分的发布机构备案。
在本部分起草过程中,起草组织者AVS技术应用联合推进工作组根据会员签署同意的AVS工作组章程
和AVS有关知识产权规定以及会员在提案、审阅等期间提出的专利披露与许可声明等对标准可能涉及的
专利进行了识别。已经确知下表列出的专利权人持有本部分的专利:
专利持有人地址
广州柯维新数码科技有限公司广州大学城外环东路232号13栋B301(510006)
华为技术有限公司广东省深圳市龙岗区坂田华为基地(518129)
北京大学深圳研究生院广东省深圳大学城北京大学深圳研究生院(518055)
清华大学北京市海淀区清华大学电子工程系(100084)
中国科学院计算技术研究所北京市海淀区中关村科学院南路6号(100080)
浙江大学浙江省杭州市浙江大学信息与通信工程研究所(310027)
联合信源数字音视频技术(北京)有限公司北京市海淀区上地东路1号盈创动力大厦A座601室(100085)
上海国茂数字技术有限公司上海市浦东张江高科技园区张衡路500弄1号楼5楼(201204)
华中科技大学湖北省武汉市洪山区珞瑜路1037号电子与信息工程系(430074)
北京工业大学北京市朝阳区平乐园100号计算机学院(100022)
上述专利权人同意对所持有的本部分的必要专利在合理和非歧视的条款和条件基础上,通过AVS专
利池进行许可。由数字音视频编解码技术标准工作组推动成立的AVS专利池管理委员会是决定专利池具
体许可条款的独立机构。对于专利池中的所有专利,标准实施者可通过专利池管理委员会认可的授权机
构获得许可。有关资料可从数字音视频编解码技术标准工作组秘书处获得,联系方法如下:
联系人:黄铁军(数字音视频编解码技术标准工作组秘书长)
通讯地址:北京大学理科2号楼2641室
邮政编码:100871
电子邮件:tjhuang@
电话:+10-62756172
传真:+10-62751638
网址:
请注意除上述专利外,本部分的某些内容仍可能涉及专利。本部分的发布机构不承担识别这些专利
的责任。
IV
GY/T257.1—2012
广播电视先进音视频编解码
第1部分:视频
1范围
本部分规定了多种比特率、分辨率和质量的视频压缩方法,并且规定了解码过程。
本部分适用于地面电视广播、有线电视广播、卫星电视广播等应用。
2规范性引用文件
下列文件对于本部分的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本部分。
凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本部分。
GB/T20090.2-2006信息技术先进音视频编码第2部分:视频
3术语和定义
下列术语和定义适用于本部分。
3.1
保留reserved
定义了一些特定语法元素值,这些值用于将来对本部分的扩展。
注:这些值不出现在符合本部分的位流中。
3.2
变长编码variablelengthcoding
一个可逆的熵编码过程,它将短的码字分配给出现频率较高的符号,将长的码字分配给出现频率较
低的符号。
3.3
变换系数transformcoefficient
变换域上的一个标量。
3.4
编码表示encodingpresentation
数据编码后的形式。
3.5
编码过程encodingprocess
产生符合本部分位流的过程。
注:本部分不规定该过程。
1
GY/T257.1—2012
3.6
编码器encoder
完成编码过程的实体。
3.7
编码图像codedpicture
一帧图像的编码表示。
3.8
标志flag
一个二值变量。
3.9
补偿compensation
求由语法元素解码得到的样本残差与其对应的预测值之和。
3.10
残差residual
样本或数据元素的重建值与其预测值之差。
3.11
参考索引referenceindex
解码图像缓冲区中参考图像或其中场的编号。
3.12
参考图像referencepicture
解码过程中用于后续图像帧间预测的图像。
3.13
层layer
位流中的分级结构,高层包含低层。编码层由高到低依次为:序列、图像、条带、宏块和块。
3.14
场field
由构成帧的三个样本矩阵中相间的行构成。
3.15
二元符号bin
组成二元符号串的符号,包括“0”和“1”。
3.16
二元符号串binstring
2
GY/T257.1—2012
有限位二元符号组成的有序序列,最左边符号是最高有效位(MSB),最右边符号是最低有效位(LSB)。
3.17
分量component
图像的三个样值矩阵(亮度和两个色度)中的一个矩阵或矩阵中的单个样值。
3.18
反变换inversetransform
将变换系数矩阵转换成空域样值矩阵的过程。
3.19
反量化dequantization
对量化系数缩放后得到变换系数的过程。
3.20
光栅扫描rasterscan
将二维矩形光栅映射到一维光栅,一维光栅的入口从二维光栅的第一行开始,然后扫描第二行、第
三行,依次类推。光栅中的行从左到右扫描。
3.21
宏块macroblock
包括一个1616的亮度样值块和对应的色度样值块。
3.22
宏块地址macroblockaddress
从图像左上角的宏块开始,沿光栅扫描的顺序编号,起始号为0。
3.23
宏块行macroblockline
在编码的图像相同的垂直位置,从左边界到右边界连续的宏块,其高度是16个样本。
3.24
宏块位置macroblockposition
图像中一个宏块的二维坐标,表示为(x,y)。
示例:如果当前图像的两场的编码数据合并成帧,图像左上角的宏块(x,y)=(0,0),对每个宏块列,从左到右x
依次加1,对每个宏块行,从上到下y依次加1。如果当前图像的两场的编码数据依次出现,第一场左上角的宏块(x,y)
=(0,0),对第一场的每个宏块列,从左到右x依次加1,对第一场的每个宏块行,从上到下y依次加1;第二场左上
角的宏块(x,y)=(0,(H+31)>>5),H是图像垂直方向扫描行数,对第二场的每个宏块列,从左到右x依次加1,对
第二场的每个宏块行,从上到下y依次加1。
3.25
后向预测backwardprediction
用显示顺序上将来的参考图像对当前图像进行预测。
3
GY/T257.1—2012
3.26
划分partitioning
将一个集合分为子集的过程。集合中的每个元素属于且只属于某一个子集。
3.27
级level
在某一类下对语法元素和语法元素参数值的限定集合。
3.28
交流系数ACcoefficient
AC系数
二维变换域上索引号不全为0的变换系数。
3.29
解码处理decodeprocessing
解析过程和解码过程。
3.30
解码过程decodingprocess
由语法元素产生解码图像的过程。
3.31
解码器decoder
完成解码处理的实体。
3.32
解码顺序decodingorder
解码过程根据图像之间的预测关系,对每帧图像解码的顺序。
3.33
解码图像decodedpicture
解码器根据位流重建的图像。
3.34
解码图像缓冲区decodedpicturebuffer
保存解码图像并用于预测、输出重排序和输出定时的缓冲区。
3.35
解析过程parse
由位流获得语法元素的过程。
3.36
禁止forbidden
4
GY/T257.1—2012
定义了一些特定语法元素值,这些值不应出现在符合本部分的位流中。
注:禁止某些值的目的通常是为了避免在位流中出现伪起始码。
3.37
块block
一个MN的样值矩阵或者变换系数矩阵(M列N行),大小为88的块又称为子块。
3.38
块扫描blockscan
量化系数的特定串行排序方式。
3.39
类profile
本部分规定的语法、语义及算法的子集。
3.40
亮度luma
表示亮度信号的样值矩阵或单个样值,符号为Y。
3.41
量化参数quantizationparameter
在解码过程对量化系数进行反量化的参数。
3.42
量化系数quantizationcoefficient
反量化前变换系数的值。
3.43
X类解码器x-profiledecoder
能够解码符合某类规定的位流的解码器。
3.44
起始码startcode
长度为32位的二进制码字,其形式在整个位流中是唯一的。
注:起始码有多种用途,其中之一是用来标识位流语法结构的开始。
3.45
前向预测forwardprediction
用显示顺序上过去的参考图像对当前图像进行预测。
3.46
前向帧间解码图像forwardinterdecodedpicture
P帧
5
GY/T257.1—2012
帧间预测中只使用前向预测解码的图像。
3.47
色度chroma
两种色差信号中任一种的样值矩阵或单个样值,符号为Cr和Cb。
3.48
视频序列sequence
编码位流的最高层语法结构,包括一个或多个连续的编码图像。
3.49
输出重排序延迟outputreorderdelay
解码位流中一帧图像到输出该解码图像之间的延迟。这是由图像显示顺序和解码顺序不同造成的。
3.50
输出处理过程outputprocessing
由解码图像得到输出帧或场的过程。
3.51
输出顺序outputorder
输出解码图像的顺序,与显示顺序相同。
3.52
双向预测bidirectionalprediction
用显示顺序上过去和将来的参考图像对当前图像进行预测。
3.53
双向帧间解码图像bidirectionalinterdecodedpicture
B帧
帧间预测中使用双向预测解码的图像。
3.54
随机访问randomaccess
从某一点而非位流起始点开始对位流解码并恢复出解码图像的能力。
3.55
随机访问点randomaccesspoint
位流中能进行随机访问的点。
3.56
填充位stuffingbits
编码时插入位流中的位串,在解码时被丢弃。
6
GY/T257.1—2012
3.57
条带slice
按光栅扫描顺序排列的若干连续宏块。
3.58
条带头sliceheader
编码的条带的一部分,是条带中宏块公用数据元素的编码表示。
3.59
跳过的宏块skippedmacroblock
除“跳过”指示外,无其他编码数据的宏块。
3.60
图像重排序picturereordering
若解码顺序和输出顺序不同,对解码图像进行重排序的过程。
3.61
位串bitstring
有限个二进制位的有序序列,其最左边位是最高有效位(MSB),最右边位是最低有效位(LSB)。
3.62
位流bitstream
编码图像所形成的二进制数据流。
3.63
位流缓冲区bitstreambuffer
存储位流的缓冲区。
3.64
位流顺序bitstreamorder
编码图像在位流中的排列顺序,与图像解码的顺序相同。
3.65
显示顺序displayorder
显示解码图像的顺序。
3.66
样本sample
构成图像的基本元素。
3.67
样本宽高比widthheightratio
7
GY/T257.1—2012
一帧图像中亮度样本列间的水平距离与行间的垂直距离之比。
表示为h:v,其中h为水平方向样本个数,v为垂直方向样本个数。
3.68
样值samplevalue
样本的幅值。
3.69
游程run
在解码过程中若干连续的相同数据元素个数。一方面指在块扫描中一个非0系数前(沿块扫描顺序)
值为0的系数的个数;另一方面指跳过的宏块的数目。
3.70
预测prediction
预测过程的具体实现。
3.71
预测过程predictionprocess
使用预测器对当前解码样值或者数据元素进行估计。
3.72
预测值predictionvalue
在样值或数据元素的解码过程中,用到的先前已解码的样值或数据元素的组合。
3.73
语法元素syntaxelement
位流中的数据单元解析后的结果。
3.74
源source
编码前视频素材或其某些属性。
3.75
运动矢量motionvector
用于帧间预测的二维矢量,由当前图像指向参考图像,其值为当前块和参考块之间的坐标偏移量。
3.76
帧frame
视频信号空间信息的表示,由一个亮度样本矩阵(Y)和两个色度样本矩阵(Cb和Cr)构成。
3.77
帧间编码intercoding
使用帧间预测对宏块或图像进行编码。
8
GY/T257.1—2012
3.78
帧间预测interprediction
使用先前解码图像(或场)生成当前图像(或场)样本预测值的过程。
3.79
帧内编码intracoding
使用帧内预测对宏块或图像进行编码。
3.80
帧内解码图像intradecodedpicture
I帧
只使用帧内预测解码的图像。
注:如果I帧采用场编码,则第一场只使用帧内预测编码。
3.81
帧内预测intraprediction
在相同解码图像(或场)中使用先前解码的样值生成当前样本预测值的过程。
3.82
直流系数DCcoefficient
DC系数
二维变换域上索引号全为0的变换系数。
3.83
字节byte
8位的位串。
3.84
字节对齐bytealignment
从位流的第一个二进制位开始,某二进制位的位置是8的整数倍。
4缩略语
下列缩略语适用于本部分。
BBV位流参考解码器(BitstreamBufferVerifier)
CBR恒定比特率(ConstantBitRate)
LSB最低有效位(LeastSignificantBit)
MB宏块(Macroblock)
MSB最高有效位(MostSignificantBit)
VLC变长编码(VariableLengthCoding)
5约定
9
GY/T257.1—2012
本部分中使用的数学运算符和优先级与C语言使用的类似。但对整型除法和算术移位操作进行了特
定定义。除特别说明外,约定编号和计数从0开始。
5.1算术运算符
算术运算符定义见表1。
表1算术运算符定义
算术运算符定义
加法运算
减法运算(二元运算符)或取反(一元前缀运算符)
乘法运算
ab幂运算,表示a的b次幂。也可表示上标
/整除运算,沿向0的取值方向截断。例如,7/4和-7/-4截断至1,-7/4和7/-4截断至-1
÷除法运算,不做截断或四舍五入
a
除法运算,不做截断或四舍五入
b
b
fi()自变量i取由a到b(含b)的所有整数值时,函数fi()的累加和
ia
a%b模运算,a除以b的余数,其中a与b都是正整数
5.2逻辑运算符
逻辑运算符定义见表2。
表2逻辑运算符定义
逻辑运算符定义
a&&ba和b之间的与逻辑运算
a||ba和b之间的或逻辑运算
!逻辑非运算
5.3关系运算符
关系运算符定义见表3。
表3关系运算符定义
关系运算符定义
>大于
>=大于或等于
<小于
<=小于或等于
==等于
!=不等于
5.4位运算符
10
GY/T257.1—2012
位运算符定义见表4。
表4位运算符定义
位运算符定义
&与运算
|或运算
~取反运算
a>>b将a以2的补码整数表示的形式向右移b位。仅当b取正数时定义此运算
a<<b将a以2的补码整数表示的形式向左移b位。仅当b取正数时定义此运算
5.5赋值
赋值运算定义见表5。
表5赋值运算定义
赋值运算定义
=赋值运算符
++递增,x++相当于x=x+1。当用于数组下标时,在自加运算前先求变量值
--递减,x--相当于x=x–1。当用于数组下标时,在自减运算前先求变量值
+=自加指定值,例如x+=3相当于x=x+3,x+=(-3)相当于x=x+(-3)
–=自减指定值,例如x–=3相当于x=x–3,,x–=(-3)相当于x=x–(-3)
5.6数学函数
数学函数定义见式(1)~式(8)。
xx;0
Abs(x).............................(1)
xx;0
式中:
x——自变量x。
Ceil(xx)..................................(2)
式中:
x——自变量x。
Clip1(xx)Clip3(0,2n1,)............................(3)
式中:
x——自变量x;
n——样本点精度。
i;xi
Clip3(i,j,x)j;xj.............................(4)
x;其他
11
GY/T257.1—2012
式中:
x——自变量x;
i——下界;
j——上界。
Median(x,y,z)xyzMin(x,Min(y,z))Max(x,Max(y,z))............(5)
式中:
x——自变量x;
y——自变量y;
z——自变量z。
x;xy
Min(xy,)............................(6)
y;xy
式中:
x——自变量x;
y——自变量y。
x;xy
Max(xy,)............................(7)
y;xy
式中:
x——自变量x;
y——自变量y。
1;x0
Sign(x).............................(8)
1;x0
式中:
x——自变量x。
5.7结构关系
结构关系符定义见表6。
表6结构关系符定义
结构关系符定义
->例如:a->b表示a是一个结构,b是a的一个成员变量
5.8位流语法、解析过程和解码过程的描述方法
5.8.1位流语法的描述方法
位流语法描述方法类似C语言。位流的语法元素使用粗体字表示,每个语法元素通过名字(用下划
线分割的英文字母组,所有字母都是小写)、语法和语义来描述。语法表和正文中语法元素的值用常规
字体表示。
某些情况下,可在语法表中应用从语法元素导出的其他变量值,这样的变量在语法表或正文中用不
带下划线的小写字母和大写字母混合命名。大写字母开头的变量用于解码当前以及相关的语法结构,也
可用于解码后续的语法结构。小写字母开头的变量只在它们所在的小节内使用。
12
GY/T257.1—2012
语法元素值的助记符和变量值的助记符与它们的值之间的关系在正文中说明。在某些情况下,二者
等同使用。助记符由一个或多个使用下划线分隔的字母组表示,每个字母组以大写字母开始,也可包括
多个大写字母。
位串的长度是4的整数倍时,可使用十六进制符号表示。十六进制的前缀是“0x”,例如“0x1a”
表示位串“00011010”。
条件语句中0表示FALSE,非0表示TRUE。
语法表描述了所有符合本部分的位流语法的超集,附加的语法限制在相关条中说明。
表7给出了描述语法的伪代码例子。当语法元素出现时,表示从位流中读一个数据单元。
表7语法描述的伪代码
伪代码描述符
/*语句是一个语法元素的描述符,或者说明语法元素的存在、类型和数值,下面给出两个例子。*/
syntax_elementue(v)
conditioningstatement
/*花括号括起来的语句组是复合语句,在功能上视作单个语句。*/
{
statement
„
推荐标准
- DB62/T 2483-2014 聚乙烯(PE)再生料 2014-07-28
- DB62/T 2476-2014 旱地冬小麦栽培技术规程 2014-07-28
- DB62/T 2460-2014 清真餐饮企业准则 2014-06-01
- DB62/T 2468-2014 单列半开放式暖棚羊舍建设技术规范 2014-05-30
- DB62/T 785-2014 旱地冬小麦全膜覆土穴播和膜侧沟播栽培技术规程 2014-07-28
- DB62/T 2467-2014 单列半开放式暖棚牛舍建设技术规范 2014-05-30
- DB62/T 2474-2014 旱地胡麻全膜覆盖栽培技术规程 2014-06-30
- DB62/T 412-2014 地理标志产品 兰州百合 2014-05-30
- DB62/T 2455-2014 铲式深松机作业质量 2014-04-21
- DB62/T 2464-2014 清真畜禽养殖生产准则 2014-06-01