LY/T 2922-2017 林业数据质量 评价方法
LY/T 2922-2017 Forestry data quality—Evaluation method
基本信息
发布历史
-
2017年10月
研制信息
- 起草单位:
- 中国林业科学研究院资源信息研究所、国家林业局信息中心、中国标准化研究院
- 起草人:
- 胡淑萍、唐小明、顾红波、白莹、程越、孙兆洋、隋媛
- 出版信息:
- 页数:30页 | 字数:56 千字 | 开本: 大16开
内容描述
ICS65.020.40
B60
中华人民共和国林业行业标准
/—
LYT29222017
林业数据质量评价方法
—
ForestrdataualitEvaluationmethod
yqy
ㅤㅤㅤㅤ
2017-10-27发布2018-01-01实施
国家林业局发布
/—
LYT29222017
目次
前言…………………………Ⅰ
1范围………………………1
2规范性引用文件…………………………1
3术语和定义………………1
4数据质量评价概述………………………3
5数据质量评价内容………………………5
6缺陷分级…………………7
7林业数据的抽样…………………………7
8数据质量检查……………8
数据质量评价……………10
9
10数据质量报告…………………………11
()………………
附录A资料性附录林业数据缺陷分级12
()……………………
附录B资料性附录数据抽样方案15
()………………
附录C资料性附录数据抽样方法示例24
ㅤㅤㅤㅤ
()………………
附录D资料性附录数据质量报告格式25
参考文献……………………27
/—
LYT29222017
林业数据质量评价方法
1范围
、、、、、、
本标准规定了林业数据质量描述框架检查方式与方法评价程序评价内容缺陷分级抽样评价
以及数据质量报告。
、、、。
本标准适用于林业数据产品规范编写数据生产过程质量检查数据产品质量检查评价与验收
2规范性引用文件
。,
下列文件对于本文件的应用是必不可少的凡是注日期的引用文件仅注日期的版本适用于本文
。,()。
件凡是不注日期的引用文件其最新版本包括所有的修改单适用于本文件
/—:()
计数抽样检验程序第部分按接收质量限检索的逐批检验抽样
GBT2828.120121AQL
计划
/—数字测绘成果质量检查与验收
GBT183162008
/—地理信息元数据
GBT197102005
/—公开版地图质量评定标准
GBT199962005
/—林业数据质量基本要素
LYT29212017
ㅤㅤㅤㅤ
3术语和定义
/—、/—及/—2012界定的下列术语和定义适用于本
GBT183162008GBT197102005GBT2828.1
文件。
3.1
质量元素ualitelement
qy
、。。
说明质量的定量定性组成部分即成果满足规定要求和使用目的的基本特征
:,。
注质量元素的适用性取决于成果的内容及其成果规范并非所有的质量元素适用于所有的成果
[/—,]
GBT183162008定义2.4
3.2
数据志lineae
g
,、、
数据的历史沿革信息包括获取或生产数据使用的原始资料说明数据处理中的参数步骤等情况
及负责单位的有关信息等。
[/—,]
GBT197102005定义4.13
3.3
单位产品item
能被单独描述和考虑的一个事物。
[/—,]
GBT2828.12012定义3.1.4
:,、、。
注单位产品可以是数据集的任何部分如要素要素间关系要素属性或它们的组合
3.4
检查批lot
,,。
由单位产品组成用来抽样与检查的数据集简称批
1
/—
LYT29222017
3.5
批量lotsize
批中包含的单位产品的个数。
[/—,]
GBT2828.12012定义3.1.14
3.6
样本samle
p
从检查批中抽取的用于检查的全部个体。
3.7
全数检查fullinsection
p
,。
对数据集中所有单位产品的检查即100%检查
3.8
抽样检查samlininsection
pgp
,。
按照一定的抽样方法从数据集中抽取样本进行的检查
3.9
缺陷defect
质量特性不满足规定的要求。
3.10
致命缺陷themostseriousdefect
,,
个体的极重要质量特性不符合规定或个体的质量特性极严重不符合规定以致不经返工处理不能
提供用户使用。
3.11
ㅤㅤㅤㅤ
严重缺陷themoreseriousdefect
,,。
个体的重要质量特性不符合规定或个体的质量特性严重不符合规定对用户有重大影响
3.12
重缺陷seriousdefect
,,。
个体的较重要质量特性不符合规定或个体的质量特性较严重不符合规定对用户有较大影响
3.13
次重缺陷sub-seriousdefect
,,。
个体的较重要质量特性不符合规定或个体的质量特性不符合规定对用户有一定影响
3.14
轻缺陷lihtdefect
g
,,。
个体的一般质量特性不符合规定或个体的质量特性轻微不符合规定对用户使用有轻微影响
3.15
次轻缺陷sub-lihtdefect
g
,,。
个体的一般质量特性不符合规定或个体的质量特性较轻微不符合规定对用户使用有微弱影响
3.16
缺陷率rateofdefect
样本中缺陷数与样本量的百分比。
3.17
不合格产品率rateofnonconforminitem
g
样本中不合格产品数与样本量的百分比。
2
/—
LYT29222017
3.18
接收质量限accetableualitlevel
pqy
可接收的批数据的最大缺陷率或不合格产品率。
4数据质量评价概述
4.1数据质量描述框架
4.1.1概述
,/—
本标准依据林业数据的度量特性将LYT29212017中的数据质量元素分为数据质量定性元素
和数据质量定量元素。
4.1.2数据质量定性元素
,、,、、、
数据质量定性元素提供概括性的非定量性的质量信息可用于评价文档数据图片音频视频等
。。
数据对用户需求的满足程度数据质量定性元素描述见表1
表1数据质量定性元素
一级质量元素描述二级质量元素描述
描述数据集对国家及林业相关法律规范的符
安全性
合程度
目的描述生产数据集的原因和预期用途
ㅤㅤㅤㅤ
,
描述数据集对于特定的应用的适满足用户要求的能力包括可提供数据格式种
可用性适用性
合程度或对于需求的符合程度类和易操作性等
用途说明数据集已经实现的应用
,、
描述数据集的历史包括数据源的状态数据
数据志
处理步骤或历史信息等
:,
注如果本标准规定的数据质量定性元素不能说明定性质量的某一方面可以命名和定义新的数据质量定性
1
元素。
注2:扩展的数据质量定性元素的名称和定义应作为数据质量信息的一部分。
4.1.3数据质量定量元素
,,、、
数据质量定量元素提供量化的质量信息用于评价空间数据表格数据制图数据对产品规范的符
。。
合程度数据质量定量元素描述见表2
表2数据质量定量元素
一级质量元素描述二级质量元素描述
多余数据集中出现的超出数据或文件
、、、
数据文件实体要素属性及关系
完整性
的存在情况遗漏数据集中缺失的数据或文件
3
/—
LYT29222017
()
表续
2
一级质量元素描述二级质量元素描述
概念一致性与概念模式规则相符
值域一致性数据值在界定值域范围内
、、、
数据文件实体要素属性和关系
逻辑一致性
符合逻辑规则的程度格式一致性存储数据与数据集物理结构的一致程度
拓扑一致性数据间拓扑关系编码的正确性
绝对位置准确度坐标值与可接受值或真值的接近程度
相对位置要素的相对位置与它们各自可接受的相对位
位置准确度空间参考系内特征位置的精度准确度置或真值的接近程度
格网数据格网数据空间位置值与可接受值或真值的接
位置准确度近程度
分类正确性依据要素及其属性的分类与论域的比较
林业实体要素和属性符合论域或非量化属性
专题准确度定性属性的正确与否
业务规则的准确程度正确性
量化属性准确度定量属性的值与可接受值或真值的接近程度
记录的时间度量值与可接受值或真值的接近
时间度量准确度
数据集的时间属性和时间关系的程度
时间质量
准确程度时间一致性事件顺序的正确性
ㅤㅤㅤㅤ
时间有效性数据相对于时间的有效性
:(),
注如果本标准中列出的数据质量定量元素含二级质量元素不能充分表达数据质量的某一方面可以命名
1
()。
和定义新的数据质量定量元素含二级质量元素
:()。
注2扩展的数据质量定量元素含二级质量元素的名称和定义应作为数据集质量信息的一部分
4.2数据质量检查方式与方法
4.2.1检查方式
林业数据质量检查的方式包括:
)。;
1全部检查对批数据中的所有个体进行逐一检查
:。
注采用计算机自动检查方法时应进行全部检查
)。,
2抽样检查按照确定的抽样方案采用适当的抽样方法从批数据中抽取部分个体作为样本进
,。
行检查并根据样本质量来判断批数据质量
:,、
注进行抽样检查的数据应是在统一的标准或规范指导下由基本相同的数据源在基本相同的时段和软硬件条件
下生产的数据。
4.2.2检查方法
数据质量检查方法包括但不限于:
)。,:、、
1计算机自动检查使用数据质量检查软件实现自动检查如计算检查数据模板分析检查空
间约束分析检查;
)。、,:
2人工检查检查人员根据有关标准或要求专家知识及经验进行的数据检查如资料对比检
、、;
查经验判断检查打印输出检查等
4
/—
LYT29222017
)。,:、
3计算机辅助检查在不能实现计算机自动检查时所采用的人机交互检查如放大漫游检查
、。
图层叠加检查数据关联检查和数据格式转换检查
4.3数据质量评价程序
,,
林业数据产品通常由多个数据集组成在对各个数据集检查评价的基础上综合评价数据产品
质量。
林业数据质量检查评价程序应包括但不限于:
),:
1制定方案其内容应包括但不限于
),;
a确定林业数据产品及其质量评价依据包括数据产品规范和用户需求等
),;
b根据数据产品内容划分数据集并确定各数据集权重
),;
c确定各数据集的质量元素包括一级质量元素和二级质量元素
),;
d依据质量元素确定检查项并依据数据集特点进行详尽列举
),;
e按质量元素和检查项制定数据产品缺陷分级表缺陷分级内容应详尽列举
)依据数据产品质量规范或用户要求确定接收质量限;
fAQL
)确定数据产品质量等级划分规则。
g
),:
2实施检查其内容包括但不限于
)、、;
a依据检查项确定数据检查方式方法以及抽样方案
),,,,;
b检查数据质量并记录缺陷等级如遇致命缺陷直接终止检查完成数据质量评价报告
),,
c汇总数据集中各检查项的检查结果根据缺陷数和样本数计算各检查项的缺陷率根据缺
,;
陷率和接收质量限确定检查项是否合格并计算检查项得分
),。
d汇总检查项得分计算数据集得分
ㅤㅤㅤㅤ
),:
3质量评价其内容包括但不限于
)汇总并记录各数据集评价结果;
a
),;
b依据各数据集权重和得分计算数据产品得分确定数据产品质量等级
)完成数据质量评价报告。
c
5数据质量评价内容
数据质量定量元素的评价内容见表3。
表3数据质量定量元素评价内容
质量元素质量子元素评价内容
,、、、、
空间数据数据文件图层实体要素属性
,、、、
表格数据数据表表关系数据项数据记录
多余
,、、、、、、、、、
制图数据数据文件图层实体要素属性符号注记图名图例比
、、
例尺坐标网图廓
:、、、、,
空间数据数据文件图层实体要素属性及要求数据集完成的其他
完整性
工作量
:、、、,
表格数据数据表表关系数据项数据记录及要求数据集完成的其他
遗漏
工作量
:、、、、、、、、、
制图数据数据文件图层实体要素属性符号注记图名图例比
、、,
例尺坐标网图廓及要求数据集完成的其他工作量
5
/—
LYT29222017
()
表续
3
质量元素质量子元素评价内容
:、、、、,、
空间数据数据文件图层实体要素属性及其各自间相互间关系
:、、,、
表格数据数据表数据项数据记录及其各自间相互间关系
概念一致性
:、、、、、、、、、
制图数据数据文件图层实体要素属性符号注记图名图例图
,、
廓及其各自间相互间关系
:
空间数据属性值
:、
值域一致性表格数据数据项值数据记录值
:、、、、
逻辑一致性制图数据属性值注记值比例尺图例图廓
:、、、、
空间数据数据文件图层实体要素属性
:、、
表格数据数据表数据项数据记录
格式一致性
:、、、、、、、、、
制图数据数据文件图层实体要素属性符号注记图名图例
图廓
:、、、,、
空间数据图层实体要素属性及其各自间相互间关系
拓扑一致性
:、、、,、
制图数据图层实体要素属性及其各自间相互间关系
:、、、
空间数据坐标系投影参数图廓点实体空间位置
绝对位置准确度
:、、、
制图数据坐标系投影参数图廓点实体空间位置
:、
空间数据实体空间位置控制点位置
位置准确度ㅤㅤㅤㅤ
:
相对位置准确度表格数据数据项值
:、、
制图数据实体空间位置控制点位置注记位置
,、、
格网数据位置准确度空间数据坐标系投影参数控制点坐标
:,
空间数据实体属性如植被类型分类正确性
:,
分类正确性表格数据数据项如地类代码
:、,
制图数据符号注记如生态区位分类正确性
:,:
空间数据实体属性如优势树种名称
:,:
表格数据数据项如树种组成
专题准确度定性属性准确度
:、、,、、
制图数据图名图例比例尺的正确性符号注记坐标网及之间穿插
,、
压盖关系附图镶图搭配布局
,,:
空间数据实体属性值如小班面积
:,:
定量属性准确度表格数据数据项如数据值及其单位
:、、、
制图数据符号注记坐标网图廓
:、、
空间数据数据源时间数据采集时间数据加工时间
,、
时间度量准确度表格数据数据采集时间数据加工时间
,、、
制图数据数据源时间数据采集时间数据加工时间
时间质量
:、
空间数据数据集数据系列的时间逻辑关系
:、
时间一致性表格数据数据集数据系列的时间逻辑关系
:、
制图数据数据集数据系列的时间逻辑关系
6
/—
LYT29222017
()
表续
3
质量元素质量子元素评价内容
:、、
空间数据数据源时间数据采集时间数据加工时间
:、
时间质量时间有效性表格数据数据采集时间数据加工时间
:、、
制图数据数据源时间数据采集时间数据加工时间
6缺陷分级
。
本标准中用缺陷来量化林业数据质量检查评价中出现的各类不符合规定的问题林业数据的缺陷
,、、、、。,
分为六级即致命缺陷严重缺陷重缺陷次重缺陷轻缺陷和次轻缺陷为便于评价数据缺陷赋予除
,。
致命缺陷以外的其他个缺陷级别之间的换算比例推荐比例为
516∶9∶5∶2∶1
、、。
空间数据表格数据制图数据的缺陷分级与不同级别缺陷的换算比例参见附录A
:,、,,
注用户应根据可用性等定性质量元素针对文档多媒体等数据类型结合实际情况制定定性数据产品评价规
、,。
则计算方法并给出综合评价结论
7林业数据的抽样
7.1概述
ㅤㅤㅤㅤ
,,、
抽样检查是数据质量检查的常用方式即用样本的质量评判批数据质量适用于质量比较稳定数
、。/—(
据量大检查费用与时间有限的情况本标准依据GBT2828.12012编制了林业数据抽样方案参
),()()、
见附录B使用者可依据批量范围N和接收质量限AQL在正常加严和放宽检验表中检索抽样
方案。
:,(,,),
注抽样方案是规定每批数据应检查的样本量和有关批数据接收准则的具体方案用表示式中为批
定制服务
推荐标准
- GB/T 14573.4-1993 声学 确定和检验机器设备规定的噪声辐射值的统计学方法 第四部分:成批机器标牌值的确定和检验方法 1993-08-28
- YY/T 0133-1993 离心薄膜蒸发器 1993-08-27
- GB 14632-1993 猎枪金属弹壳 1993-08-29
- GB/T 14573.3-1993 声学 确定和检验机器设备规定的噪声辐射值的统计学方法 第三部分:成批机器标牌值的确定和检验简易(过渡)法 1993-08-28
- GB 14631-1993 猎枪底火 1993-08-29
- GB 14630-1993 猎枪 1993-08-29
- GB/T 3358.1-1993 统计学术语 第一部分 一般统计术语 1993-08-28
- GB/T 3358.3-1993 统计学术语 第三部分 试验设计术语 1993-08-28
- GB/T 14573.2-1993 声学 确定和检验机器设备规定的噪声辐射值的统计学方法 第二部分:单台机器标牌值的确定和检验方法 1993-08-28
- GB/T 14573.1-1993 声学 确定和检验机器设备规定的噪声辐射值的统计学方法 第一部分:概述与定义 1993-08-28