T/SAIAS 0013.4-2023 教育通用人工智能大模型第4部分：测评规范

T/SAIAS 0013.4-2023

团体标准中文(简体) 现行页数：15页 | 格式：PDF

基本信息

标准号

T/SAIAS 0013.4-2023

标准类型

团体标准

标准状态

现行

中国标准分类号（CCS）

国际标准分类号（ICS）

35.240.01 信息技术应用综合

发布日期

2023-07-08

实施日期

2023-08-08

发布单位/组织

归口单位

上海市人工智能行业协会

适用范围

范围:本文件规定了教育通用人工智能大模型的测评框架、测评指标、测评维度和测评方法。本文件适用于教育通用人工智能大模型的基础能力和教学功能的测评; 主要技术内容:本文件规定了一系列用于评估大模型全方面能力的测评指标、综合测试模型本身的自然语言处理能力、模型应用于各教育场景的能力、模型的价值观、安全性和数据合规性等各个方面。对以上每一个维度的测评、都相应需要一个高质量的动态更新的测评数据。1.教育通用人工智能大模型测评框架包括测评指标、测评维度、测评数据集、模型基础能力测评和安全风险测评五个部分。2.本文件定义了3个一级测评指标和12个二级测评指标，4个一级测评维度、19个二级测评维度和76个三级测评维度。每一个三级测评维度、需要用相应的测试数据集进行相应指标的测评。3.所有测评维度可以单独测试或者选择部分测试维度组成一个测试子集、或者选择全集进行组合测试。模型基础能力和安全风险测评维度可以参考已有的团体、行业、国家或国际标准

发布历史

2023年07月

T/SAIAS 0013.4-2023　教育通用人工智能大模型第4部分：测评规范

当前标准现行 2023-07-08

文前页预览

T/SAIAS 0013.4-2023 教育通用人工智能大模型第4部分：测评规范-第1页

T/SAIAS 0013.4-2023 教育通用人工智能大模型第4部分：测评规范-第2页

T/SAIAS 0013.4-2023 教育通用人工智能大模型第4部分：测评规范-第3页

T/SAIAS 0013.4-2023 教育通用人工智能大模型第4部分：测评规范-第4页

研制信息

起草单位：: 上海交通大学、华东师范大学、百度网讯科技有限公司、科大讯飞股份有限公司、华为技术有限公司、上海市人工智能行业协会、网易有道信息技术（北京）有限公司、新华三技术有限公司、阿里云计算有限公司、北京高思博乐教育科技股份有限公司、思必驰科技股份有限公司、清华大学、北京邮电大学、国家开放大学、华中师范大学、江苏师范大学、青岛伟东云教育集团有限公司、山东悦知教育科技有限公司、北京世纪好未来教育科技有限公司、第四范式（北京）技术有限公司、北京市第二十中学、江苏中教科信息技术有限公司、成都康赛信息技术有限公司