DB3302/T 1163-2024 基层智治公共数据整合规范
DB3302/T 1163-2024 Governing at grassroots level and integrating public data specification
基本信息
发布历史
-
2024年06月
文前页预览
研制信息
- 起草单位:
- 宁波市数据局、宁波市标准化研究院、中国电信股份有限公司宁波分公司、宁波市电子文件备份中心
- 起草人:
- 尤波军、郑从卓、赵英、霍斯科、王铮麟、吴建港、王霄翔、常飞、曾祺惠、余兆力、郑壹裕、张翔
- 出版信息:
- 页数:13页 | 字数:- | 开本: -
内容描述
ICS35.240.99
CCSL74
3302
浙江省宁波市地方标准
DB3302/T1163—2024
基层智治公共数据整合规范
Specificationforpublicdataintegrationofgrass-rootsintelligentgovernance
2024-06-03发布2024-07-03实施
宁波市市场监督管理局发布
DB3302/T1163—2024
前言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定
起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由宁波市数据局提出、归口并组织实施。
本文件起草单位:宁波市数据局、宁波市标准化研究院、中国电信股份有限公司宁波分公司、宁波
市电子文件备份中心。
本文件主要起草人:尤波军、郑从卓、赵英、霍斯科、王铮麟、吴建港、王霄翔、常飞、曾祺惠、
余兆力、郑壹裕、张翔。
I
DB3302/T1163—2024
基层智治公共数据整合规范
1范围
本文件规定了基层智治公共数据的整合原则、整合内容、流程和要求。
本文件适用于基层智治公共数据信息的整合处理。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB/T22239—2019信息安全技术网络安全等级保护基本要求
GB/T33745—2017物联网术语
GB/T39477—2020信息安全技术政务信息共享数据安全技术要求
DB33/T2487公共数据安全体系建设指南
DB3302/T1126—2021公共数据管理数据共享规范
3术语和定义
GB/T33745—2017界定的以及下列术语和定义适用于本文件。
3.1
数据整合dataintegration
将分散的一组或多组数据,按照一定规则组织在一起,使其相互协调一致,通过一定处理过程以获
得新的或更高质量信息的过程。
[来源:GB/T33745—2017,2.5.6,有修改]
4整合原则
数据整合应遵循以下原则:
a)完整性:对数据项的补充和完善,使数据信息内容齐全;
b)准确性:通过动态更新和错误识别,使数据信息符合实际;
c)及时性:根据数据来源,通过自动或手动更新的方式按规定频率维护数据信息;
d)一致性:整合前后数据信息内容、含义无歧义;
e)关联性:多源数据之间建立对应关系,相互关联的数据信息内容无矛盾。
5整合内容
包括分布于分散的业务管理系统,应用于基层治理领域,覆盖社会组织、社会事务、社会工作、社
会救助、智慧养老、区划地名等业务的数据信息,包括但不限于:
a)公民信息,
1
DB3302/T1163—2024
b)法人信息,
c)房屋信息,
d)地址信息。
6整合流程
包括数据归集、数据处理、质量控制、成果形成四个流程环节(见图1)。
回流数据
人工采集
数据
数据归集
加工数据
物联感知
数据
数据清洗
数据处理
数据完善
数据关联
数据分类
质量控制
成果形成
图1数据整合流程图
2
DB3302/T1163—2024
7整合要求
7.1数据归集
7.1.1回流数据
根据应用需求,通过一体化数字资源系统(IRS)或接口共享,批量获取表和字段等信息。
7.1.2人工采集数据
由基层网格团队采集公民(及其家庭)、法人、房屋、地址等基础信息。
7.1.3加工数据
以7.1.1或7.1.2方式归集的数据经加工或建模形成数据信息。
7.1.4物联感知数据
通过影像采集、AI识别、智能感知等设备终端获取或加工形成数据信息。
7.2数据处理
7.2.1数据清洗
7.2.1.1回流数据应授权到应用数据仓进行清洗。
7.2.1.2人工采集数据应以村(社区)为单位进行整体初始化。
7.2.1.3对数据进行排序算法,按照预定义的重复标识规则进行检测和去重,对删除数据进行单独备
份。
7.2.1.4对数据按照重要性等级进行判断,根据判断结果和缺失比例制定规则进行删除或填充,对删
除数据单独备份。
7.2.1.5用统计分析方法、简单规则库或不同属性间的约束、外部数据进行检测、识别,修正错误值
或异常值。
7.2.1.6对多源数据进行关联性验证,调整、去除关联数据间的矛盾内容,并通过分析检测,使数据
保持一致。
7.2.1.7对包括但不限于时间、日期、数值等错误显示的格式进行清洗。
7.2.2数据完善
7.2.2.1按照DB3302/T1126—2021附录B对数据的名称、类型、格式进行统一。
7.2.2.2应对错项、空项数据进行核实、修正。
7.2.2.3根据产权部门、更新时间、数据质量等属性,建立数据更新机制和多源数据的优先级。
示例:公民数据更新,以公安部门七个法定字段,即姓名、曾用名、性别、民族、身份证号、户籍地址、出生日期,
为基本数据,其他字段按照数源单位最新的更新时间为准,针对一数多源情况(如一个人在五个部门所属系统中登记有
五个电话号码,且无法确定准确性),由基层网格团队进行核查补充,确认上报最新数据,进行数据更新。
7.2.3数据关联
对数据设置标签(见附录A),并建立人房数据关联、人地数据关联、人企数据关联、房地数据关
联、房企数据关联等。
7.2.4数据分类
3
DB3302/T1163—2024
基于基础数据指标清洗和标签设置结合智能分析技术,对数据仓库进行建设,并对数据进行管理,
利用系统加工能力及数据能力,组装成为数据专题在业务系统间进行共享使用,并为应用服务、智能识
别、风险模型的建立提供数据及技术支撑。
示例:基层治理事件智能识别模型(见附录B)。
7.3质量控制
7.3.1数据质量应按DB3302/T1126—2021中“完整性、准确性、及时性、一致性、关联性”的维度
设置和8.3中对应的计算方法进行评估。
7.3.2应对数据实行动态管理,实现回流、共享数据自动更新。人工采集数据经核实后手动更新,并
根据应用需要设置手动更新提醒与操作权限。
7.3.3应符合GB/T22239—2019中的第三级安全要求,GB/T39477—2020第6章的要求,以及DB33/T
2487对网络系统与数据应用安全的要求。
7.4成果形成
7.4.1应形成数据库及相应数据元,整合过程相关记录、文档等整合成果。
7.4.2数据元应具备数据建模的可用性、可读性。
7.4.3不同来源的相同数据元应保持一致,并建立对应关系(见附录C)。
4
DB3302/T1163—2024
A
A
附录A
(资料性)
数据标签表
数据标签见表A.1。
表A.1数据标签表
序号标签名称判断逻辑更新频率
1法人代表基层人口库中名下有经营性主体每天
2侨台联工作对象基层人口库有侨台联工作对象标签每天
3社会组织骨干基层人口库有社会组织骨干标签每天
4人民调解员基层人口库中存在人民调解员标签每天
5残疾人残疾人基本信息表存在残疾证号码信息每天
6重病卧床老人基层人口库中有重病卧床老人标签每天
7孤寡空巢老人基层人口库中有孤寡空巢老人标签每天
8孕妇医疗卫生领域孕妇基本信息表中存在记录每天
960岁以上老人基层人口库中年龄大于60岁的本地户籍人口每天
1080岁以上老人基层人口库中年龄大于80岁的本地户籍人口每天
11婚姻状况根据婚姻记录取出最新的婚姻状况实时
12死亡四个来源通过身份证号判断只要其一存在死亡记录实时
13是否事业单位人员社保缴纳是否在事业单位每月
14是否股份合作社人员是否在股份合作社人员表中
推荐标准
- DB35/ 1311-2013 水泥工业大气污染物排放标准 2013-01-21
- DB35/T 1302-2012 建筑排水用硬聚氯乙烯(PVC-U)内螺旋管材 2012-11-27
- DB35/T 1304-2012 LED显示屏 2012-11-27
- DB35/T 1281-2012 菜用大豆生产技术规程 2012-11-02
- DB35/T 1280-2012 大豆疫霉菌分子检测技术规程 2012-11-02
- DB35/T 1307-2012 公路隧道照明用LED灯具 2012-11-27
- DB35/T 1279-2012 公路沥青路面就地热再生技术规程 2012-11-02
- DB35/T 1285-2012 汽车加油加气站雷电灾害应急预案编制导则 2012-11-02
- DB35/T 1292-2012 鲍工厂化养殖技术规范 2012-11-02
- DB35/T 1287-2012 城市流浪乞讨受助人员护送返乡工作规范 2012-11-02