GB/T 20090.1-2012 信息技术 先进音视频编码 第1部分:系统
GB/T 20090.1-2012 Information technology—Advanced coding of audio and video—Part 1:System
基本信息
发布历史
-
2012年12月
研制信息
- 起草单位:
- 中国科学院计算技术研究所、清华大学、北京算通科技发展有限公司、中国电子技术标准化研究院、北京大学、华中科技大学、北京邮电大学、联合信源数字音视频技术(北京)有限公司、展讯通信(上海)有限公司
- 起草人:
- 陈熙霖、杨士强、高鹏飞、霍龙社、高麟鹏、丁亚强、杨志杰、林福辉、牟伦田、王啸、朱光喜、林永兵、贺玉文、喻莉、王雷、冯博、张桢睿、杨昭辉、杨洁、汪恒晶、高文、黄铁军、卢汉清
- 出版信息:
- 页数:148页 | 字数:285 千字 | 开本: 大16开
内容描述
中华人民共和国国家标准
信息技术先进音视频编码第1部分:系统
Informationtechnology-Advancedcodingofaudioandvideo-Part1:System
GB/T20090.1-2012
发布日期:2012年12月31日
实施日期:2013年6月1日
中华人民共和国国家质量监督检验检疫总局
中国国家标准化管理委员会发布
引言
0.1综述
GB/T20090的本部分论述了如何将一路或多路音频、视频位流或其他基本数据流合成单路或多路复用流,用于存储和传送。系统编码遵循
本部分指定的语法和语义规则,并提供了使解码器缓冲区能在一定范围的补偿和接收条件下进行同步解码的信息。
系统编码包含两种形式:传输流和节目流,分别针对不同的应用加以优化。本部分中定义的传输流和节目流提供了编码语法,该语法对于同
步解码及展现音频、视频信息是充分且必要的,同时保证了解码器中数据缓冲区不发生上溢和下溢。该语法中应至少包含以下两种信息之一:
a)有关展现编码的音频和视频数据的相对时间戳,以及有关数据流本身传送的比特率信息;
b)有关解码和展现编码的音频和视频数据的时间戳,以及有关数据流本身传送的时间戳信息。传输流和节目流都是面向分组包的多路复用
流。
单一音频和视频基本流的多路复用过程见图1。视频和音频数据可按包括GB/T20090.2和GB/T20090.3等部分进行编码,之后,压缩数
据被打包以形成PES分组包。在形成PES分组包的过程中,当独立使用传输流或节目流的PES分组包时可能会加入所需的描述信息;而PES分组包需
要进一步与系统层信息结合形成传输流或节目流时,不包含这一信息。本部分覆盖了图1中竖直虚线右边所示的处理过程。
图1多路复用过程简图
本部分定义的节目流是由具有共同时间基准的一个或多个PES分组包合并而成的单一流。有些应用中要求包含单个节目的基本流是未多路复
用的分离流。对这些应用,基本流也可作为分离的节目流编码。每一基本流含一个节目流且具有共同时间基准。在这种情况下,不同流中SCR字
段的编码值应一致。
所有的基本流和单一节目流都可被同步解码。
节目流被设计用于相对无差错环境中,且适用于诸如交互式多媒体等应用。节目流分组包长度可变。
传输流是由一个或多个节目组成的单一流,且这些节目可包含一个或多个不同时钟基准。由同一个节目中的多个基本流所组成的多个PES分
组包共享一个时钟基准。传输流是为用于可能出现差错的有损或有噪媒体中的存储或传输环境而设计的。传输流分组包长度为188字节。
节目流和传输流是为不同应用设计的,它们的定义并不严格遵守分层模型,彼此之间可相互转换,但并不互为子集或超集。可以从一个传输
流中抽取一个节目的内容并创建一个有效的节目流。该转换可利用PES分组包的公共互换格式完成,但并非节目流需要的所有字段都包含在传输
流中,有一些需要导出。而在分层模型中,传输流可能横跨多个层,并易于在宽带应用中实现。
本部分描述的语法规则和语义规则的范围是不同的:语法规则仅用于系统层编码,并不延伸到GB/T20090.2和GB/T20090.3中所描述的
压缩层编码,而语义规则适用于复用流。
本部分未规定编码器或解码器的体系结构或实现方法,也未对多路复用器或解复用器作相应的规定。然而,位流的性质对编码器、解码器、
多路复用器和解复用器提出了功能和性能上的要求,如编码器应满足最小的时钟容差要求,但这些要求并不妨碍编码器、解码器、多路复用器和
解复用器的设计与实现的灵活性。
0.2传输流
传输流是针对在那些可能会出现显著错误(往往表现为位差错或分组包丢失)的环境中进行节目传送和存储而定义的一种流。这些节目包含按
照GB/T20090.2和GB/T20090.3等部分定义的编码数据以及其他数据。
想获取更多免费高清规范,请关注微信公众号:建筑规范之家。1
传输流的速率可以是恒定或可变的。在任何情况下,所包含的基本流的速率也可以是恒定或可变的。在每一种情况下,流的语法或语义限制
是相同的,传输流速率由传输率(transport_rate)字段的值定义,这些传输率字段嵌入在每个流中。
一个包含多个具有独立时间基准的节目传输流会造成总体比特率可变,这会给构造和传送这样的位流带来一定困难,见6.2.2。
只要能够生成一个有效的流,包含一个或多个节目的传输流可以从基本编码数据流、节目流或其他可能包含一个或多个节目的传输流构造生
成。
传输流是按照在最小开销的情况下能对传输流执行某些操作的原则而设计的。这些操作包括:
a)从传输流的一个节目中获得编码数据、解码并展现,如图2所示;
b)从传输流的一个节目中抽取传输流分组包并生成一个仅包含该节目的新的传输流作为输出,如图3所示;
c)从一个或多个传输流中抽取一个或多个节目的传输流分组包并生成一个新的传输流;
d)从传输流中抽取一个节目内容并生成包含该节目的一个节目流,如图4所示;
e)把一个节目流转化为传输流,并在有损环境中传输。然后再重建一个有效的、在某些情况下完全相同的节目流。
图2和图3描述了以一个传输流作为输入的解复用及解码系统原型。图2说明了第一种情况,即一个传输流被直接解复用和解码。传输流构造
分为两层:系统层和压缩层。
传输流解码器的输入流由一个包含压缩层的系统层组成。音频解码器及视频解码器的输入流只包含压缩层。
接收传输流的解码器原型的操作既适用于整个传输流(复用流操作),也适用于单个基本流(特定流操作)。传输流系统层被分为两个子层,一
个用于复用流操作(传输流分组包),另一个用于特定流操作(PES分组包层)。
图2也给出了一个包括视频和音频的传输流解码器原型以说明解码器的功能,其结构并不是唯一的,但该图有助于理解。解码器时间控制等
系统解码器功能可能被等价地实现在基本流解码器或信道特定解码器中。类似地,信道专用解码器测出的错误也可以用多种途径通知独立的音频
和视频解码器。这些通信途径并未显示在图中,该解码器原型的设计并不意味着对传输流解码器的设计作出任何必达的要求。实际上,非音视频
数据也是允许的,但并未在图2中画出。
图2传输流解复用和解码原型示例
图3说明了另一种情况,即一个包含多个节目的传输流被转变为一个只含单个节目的传输流,这种情况下的再复用操作可能需要纠正
transport_rate值以补偿位流中传输率的变化。
图3传输多路复用原型示例
图4说明了一个多节目传输流先被解复用再转变为节目流的情况。
图4传输流到节目流转换原型示例
图3和图4指出,不同类型、不同构造的传输流之间的转换是可能且合理的。在传输流和节目流的语法中都定义了一些特定字段以方便上述转
换过程,但并不要求解复用器或解码器的具体实现要包含以上所有功能。
0.3节目流
节目流是针对在那些出错率很低,且系统编码的处理过程作为主要考虑因素的环境中进行一个节目的传送和存储而定义的一种流,该节目流
包含编码数据和其他数据。
想获取更多免费高清规范,请关注微信公众号:建筑规范之家。2
节目流的速率可以是恒定的或可变的。在任何情况下,所包含的基本流的速率也是恒定或可变的。在每一种情况下,节目流的语法或语义限
制是相同的。节目流速率是由系统时钟参考(SCR)字段与mux_rate字段的值和位置所决定的。
图5描述了一个音视频节目流解码系统原型。该图用于帮助理解,其结构并不是唯一的——包括解码器时间控制在内的系统解码器功能可能
被等价地实现在基本流解码器或信道特定解码器中。该解码器原型的设计并不意味着对节目流解码器的设计作出任何必达的要求。实际上,非音
视频数据也是允许的。
图5所示的节目流解码器原型是由系统、视频和音频解码器三部分组成,它们分别符合GB/T20090.1、GB/T20090.2和GB/T20090.
3。在该解码器中,单路或多路音视频位流的复用编码表示假定以某种特定信道格式在特定信道中存储或传输。特定信道格式本部分不作规定,
特定信道解码也不是本解码器原型的一部分。
图5节目流解码器原型
上述原型解码器接受节目流作为输入,并依靠节目流解码器从流中提取信息。节目流解码器分离复用流,并将由此产生的基本流作为音频和
视频解码器的输入。音频和视频解码器的输出是已解码的音频和视频信号。节目流解码器、音频和视频解码器以及信道专用解码器之间的定时信
息流应包含在设计中,但并未在图5中画出。利用定时信息,音频和视频解码器相互之间及与信道之间可以实现同步。
节目流构造分为两层:系统层和压缩层。节目流解码器的输入流由一个包含压缩层的系统层组成。音频解码器及视频解码器的输入流只包含
压缩层。
解码器原型的操作既适用于整个节目流(复用流操作)。也适用于单个基本流(特定流操作)。节目流系统层被分为两个子层,一个用于复用流
操作(节目流分组包层),另一个用于特定流操作(PES分组包层)。
0.4传输流与节目流的转换
利用PES分组包,传输流与节目流之间的转换是可能且合理的,这是由包含在本部分的6.1和7.1中的传输流和节目流规范得出的。在某些
限制下,PES分组包可能直接从一个复用位流的有效数据对应到另一个复用位流的有效数据。如果在所有PES分组包中都有
program_packet_sequence_counter,就可能标识出PES分组包的正确次序以帮助实现这一功能。
在这两种流中,有关转换所需的其他信息包括基本流之间的关系以表和包头的形式出现。在任何流中这些数据如果出现,转换前后都应是正
确的。
0.5PES流
正如6.3.6中的语法定义所指出,传输流和节目流是从PES分组包中逻辑地建立的。PES分组包被用于传输流与节目流之间的转换。在有些
场合进行这种转换时,无需变动PES分组包。PES分组包的长度可能比传输流分组包的长度大得多。
包含相同stream_id和基本流的一系列连续的PES分组包构成一个PES流。当PES流分组包用于形成PES流时,应在6.3.8中所定义的限制下,
带有基本流时钟参考(ESCR)字段和基本流速率(ES_Rate)字段。PES流数据应是来自基本流且保持原次序的连续字节。PES流中不包含某些出现在
节目流和传输流中的系统信息,包括在包头、系统头、节目流映射、节目流目录、节目映射表中出现的信息以及在传输流分组包语法中定义的元
素。
本部分的PES流未定义用于相互交换和交互操作。单个基本流也可打包成传输流或节目流,但应包含必要的系统信息。具有单个基本流的多
个传输流或节目流可被构造成具有相同的时间基准以传送一个完整的音视频节目。
0.6定时模型
系统、视频和音频都有一个定时模型,其中从编码器的信号输入到解码器的信号输出之间的端到端延迟是恒定的,该延迟是编码、编码器缓
冲、多路复用、传送或存储、解复用、解码器缓冲和展现过程中所有延迟的总和。作为该定时模型的一部分,所有视频图像和音频采样仅展现一
次(除非经过特殊编码),且解码器中的视频帧率和音频采样速率与在编码器中保持一致。系统流编码包括了定时信息,以用于实现端到端延迟恒
定的系统。实现不严格遵守该模型的解码器也是可能的。但此时的解码器需要负责以一种可接受方式完成以上要求。
所有定时是由一个公共时钟来定义的,这个公共时钟被称为系统时钟。在节目流中,该时钟与视频或音频采样时钟之间可以有确定的比值,
也可以有一个与比值略有偏差的工作频率,但仍提供精确的端到端定时和时钟补偿。
在传输流中,为了简化解码器中的采样速率恢复,系统时钟被限制为在任何时刻均与音频和视频采样时钟保持确定比值。
0.7条件接收
本部分未规定条件接收机制,但AVS位流支持对节目流和传输流中的节目进行条件接收。
0.8复用流操作
复用流操作包括协调信道数据的获取、时钟的调整以及缓冲区的管理。这些操作是紧密相连的。当信道数据传输速率是可控时,可通过调节
数据传输速率使解码缓冲区不发生上溢或下溢。否则,基本流解码器的定时应服从信道中接收的数据,以避免上溢或下溢。
想获取更多免费高清规范,请关注微信公众号:建筑规范之家。3
节目流由节目流分组包组成,其包头有助于以上任务的完成。包头指定了从信道中送来的每一字节进入节目流解码器的预定时间,这个预定
到达时刻表作为时钟校正和缓冲区管理的参考。当解码器不能严格遵守该时刻表时,应对有关偏差作出相应补偿。
推荐标准
- DB54/T 0265-2022 “互联网+政务服务”平台网站设计规范 2022-05-06
- DB1408/T 033-2022 韭菜长途运输包装技术规范 2022-04-20
- DB54/T 0263-2022 政务信息资源目录编制指南 2022-05-06
- DB54/T 0259-2022 牦牛选育技术规程 2022-05-06
- DB54/T 0258-2022 牦牛屠宰技术规程 2022-05-06
- DB1408/T 032-2022 茶菊种植技术规程 2022-04-20
- DB54/T 0261-2022 “互联网+政务服务”平台对接技术规范 2022-05-06
- DB54/T 0266-2022 政务服务统一公共支付对接技术规范 2022-05-06
- DB54/T 0262-2022 政务信息数据共享交换平台技术规范 2022-05-06
- DB54/T 0260-2022 西藏绒山羊人工授精技术规程 2022-05-06