T/BECC 002-2024 智算中心技术要求和评估方法

T/BECC 002-2024 Technical requirements and evaluation method of artificial intelligence computing center

团体标准 中文简体 现行 页数:44页 | 格式:PDF

基本信息

标准号
T/BECC 002-2024
标准类型
团体标准
标准状态
现行
中国标准分类号(CCS)
-
国际标准分类号(ICS)
发布日期
2024-03-28
实施日期
2024-04-02
发布单位/组织
北京电子商会
归口单位
北京电子商会
适用范围
本文件规定了智算中心的服务分类、功能架构、通用要求、智算基础设施、智算基础平台、机器学习平台、大模型智算平台、统一监控运营平台的技术要求和评估方法。 本文件适用于指导智算中心的研发、设计、建设和运营。

发布历史

文前页预览

研制信息

起草单位:
北京电子控股有限责任公司、北京电子数智科技有限责任公司、阿里云计算有限公司、新华三集团、首都信息发展股份有限公司、中国软件评测中心、北京电子城数智科技有限公司、中国电信股份有限公司北京分公司、中电云计算技术有限公司、浪潮(北京)电子信息产业有限公司
起草人:
王琳、杨坤、徐文星、陆海翔、刘如冰、王磊、魏诗雅、郭磊、师宇、杨鑫、孙东明、李辉、于波、徐高杰、杨景、刘小健、刘俊伟、马辉、兰文丽、赵德智、郝杰
出版信息:
页数:44页 | 字数:73 千字 | 开本: 大16开

内容描述

ICS35040

CCSI6.540

团体标准

T/BECC002—2024

智算中心技术要求和评估方法

Technicalrequirementsandevaluationmethodofartificial

intelligencecomputingcenter

2024-03-28发布2024-04-02实施

北京电子商会发布

中国标准出版社出版

T/BECC002—2024

目次

前言

…………………………Ⅲ

引言

…………………………Ⅳ

范围

1………………………1

规范性引用文件

2…………………………1

术语和定义

3………………1

缩略语

4……………………1

智算中心总体要求

5………………………2

智算中心服务分类

5.1…………………2

智算中心功能架构

5.2…………………2

智算中心通用要求

5.3…………………3

智算基础设施

6……………5

机房

6.1IDC……………5

网络交换机

6.2…………………………9

智算算力服务器

6.3……………………11

通用计算服务器

6.4……………………12

存储服务器

6.5…………………………12

安全服务器

6.6…………………………13

智算基础平台

7……………13

算力服务

7.1……………13

容器服务

7.2……………13

容器镜像服务

7.3………………………13

网络服务

7.4……………14

存储服务

7.5……………14

安全服务

7.6……………14

机器学习平台

8……………15

总体要求

8.1……………15

数据预处理

8.2…………………………15

模型开发

8.3……………16

模型训练

8.4……………16

模型推理

8.5……………16

模型优化

8.6……………17

模型评估

8.7……………17

模型纳管

8.8……………17

T/BECC002—2024

模型部署

8.9……………18

大模型智算平台

9…………………………18

总体要求

9.1……………18

数据采集

9.2……………19

大模型训练

9.3…………………………19

大模型微调

9.4…………………………19

大模型推理

9.5…………………………20

大模型多模纳管

9.6……………………20

统一监控运营平台

10……………………20

平台业务流程

10.1……………………20

统一门户

10.2…………………………21

用户控制台

10.3………………………21

资源管理

10.4…………………………21

运营管理

10.5…………………………22

运维管理

10.6…………………………22

融合多租户管理

10.7…………………22

统一安全管理

10.8……………………23

自动化安装部署

10.9…………………23

通用基础平台

10.10……………………23

机器学习平台和大模型智算平台的运营

10.11………23

智算中心评估方法

11……………………23

评估原则

11.1…………………………23

评估内容与指标

11.2…………………24

评估方法

11.3…………………………24

评估结论与判定

11.4…………………24

附录资料性智算中心典型场景案例

A()………………25

附录资料性智算中心统一监控运营平台相关能力

B()………………32

参考文献

……………………36

T/BECC002—2024

前言

本文件按照标准化工作导则第部分标准化文件的结构和起草规则的规定

GB/T1.1—2020《1:》

起草

请注意本文件的某些内容可能涉及专利本文件的发布机构不承担识别专利的责任

,。

本文件由北京电子商会提出并归口

本文件起草单位北京电子控股有限责任公司北京电子数智科技有限责任公司阿里云计算有限

:、、

公司新华三集团首都信息发展股份有限公司中国软件评测中心北京电子城数智科技有限公司

、、、、、

中国电信股份有限公司北京分公司中电云计算技术有限公司浪潮北京电子信息产业有限公司

、、()。

本文件主要起草人王琳杨坤徐文星陆海翔刘如冰王磊魏诗雅郭磊师宇杨鑫孙东明

:、、、、、、、、、、、

李辉于波徐高杰杨景刘小健刘俊伟马辉兰文丽赵德智郝杰

、、、、、、、、、。

技术审查专家吴志刚张群张东于铁强蔡春久胡良霖曹建彤朱大培陈玉峰张雅彬

:、、、、、、、、、、

马福忠

T/BECC002—2024

引言

智算中心是开展算力资源服务支撑各领域开展数据运营的重要基础设施之一目前智算中心存

,。,

在能力等级不清晰度量指标不统一服务商的服务能力不明确等问题亟待解决的典型问题包括

、、。:

对于中等复杂模型算力预训练微调检验回归测试全流程的效率较低

a),、、、;

算力隔离问题号称支持多个隔离与实际效果不符缺乏隔离评价机制

b),CPU,;

如何保障存储算力负载全链路的高效可靠

c)、、。

因此急需制定本文件从用户对算力服务的不同需求数据应用服务的不同环节采集传输交互

,,、(、、

加工处理分析建模应用服务等出发明确算力服务类别功能性能要求和评估方法等作为智算中心

、、),、,

建设评估参考依据

/:

便于用户依据应用场景资金预算对算力服务的选型参考

a)、;

为算力服务供应链各方的产品研发和统一对接提供参考标准实现高效高质量高性价比的

b),、、

算力服务

;

为政府企事业单位等各类算力用户第三方评估机构开展算力服务评价提供参考依据

c)、/。

T/BECC002—2024

智算中心技术要求和评估方法

1范围

本文件规定了智算中心的服务分类功能架构通用要求智算基础设施智算基础平台机器学习

、、、、、

平台大模型智算平台统一监控运营平台的技术要求和评估方法

、、。

本文件适用于指导智算中心的研发设计建设和运营

、、。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款其中注日期的引用文

。,

件仅该日期对应的版本适用于本文件不注日期的引用文件其最新版本包括所有的修改单适用于

,;,()

本文件

洁净厂房设计规范

GB50073—2013

火灾自动报警系统设计规范

GB50116—2013

3术语和定义

下列术语和定义适用于本文件

31

.

智算中心artificialintelligencecomputingcenter

具备智能计算存储高性能网络容器安全等基础设施和服务通过机器学习平台和大模型智算

、、、、,

平台为各类智算场景和应用提供人工智能算力大模型开发训练和统一监控运营等服务的系统

、。

32

.

训练training

利用数据基于机器学习算法建立或改进机器学习模型参数的过程

,,。

来源

[:ISO/IEC22989:2022,3.3.15]

33

.

推理inference

计算机根据已知信息进行分析分类或诊断做出假设解决问题或者给出推断的过程

、,,。

来源

[:GB/T42018—2022,3.12]

4缩略语

下列缩略语适用于本文件

生成式人工智能

AIGC:(ArtificialIntelligenceGeneratedContent)

应用程序编程接口

API:(ApplicationProgrammingInterface)

中央处理器

CPU:(CentralProcessingUnit)

图形处理器

GPU:(GraphicsProcessingUnit)

1

定制服务

    推荐标准