GB/T 30541-2014 文献管理 电子内容/文档管理(CDM)数据交换格式

GB/T 30541-2014 Document management—Electronic content/document management(CDM)data interchange format

国家标准 中文简体 现行 页数:14页 | 格式:PDF

基本信息

标准号
GB/T 30541-2014
标准类型
国家标准
标准状态
现行
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2014-05-06
实施日期
2014-11-01
发布单位/组织
中华人民共和国国家质量监督检验检疫总局、中国国家标准化管理委员会
归口单位
全国文献影像技术标准化技术委员会(SAC/TC 86)
适用范围
本标准定义了内容/文档管理(Content/Document Management,CDM)数据的交换以及相关的资源。

发布历史

研制信息

起草单位:
全国文献影像技术标准化技术委员会第五分委员会
起草人:
杨吉江、程真、薛四新、徐周亚
出版信息:
页数:14页 | 字数:22 千字 | 开本: 大16开

内容描述

ICS37.080

A14GB

-=H工

中华人民

和国国家标准

J,、

GB/T30541-2014/ISO22938:2008

文献管理电子内容/文档

管理化DM)数据交换格式

Documentmanagement-Electroniccontent/document

management(CDM)datainterchangeformat

CISO22938:2008,IDT)

2014-11-01实施

2014-05-06发布

中华人民共和国国家质量监督检验检疫总局

发布

中国国家标准化管理委员会

GB/T30541-2014/ISO22938:2008

目次

前言………………………·…I

引言………………………·…E

1范围·

2规范性引用文件-

3术语和定义·

4符号和缩略语·················……….1

5基于XML的数据交换格式

5.1概述

5.2XML用于内容/文档管理数据…………………….2

5.3用于CDM数据交换的具体DTD………….4

5.4使用DTD代表CDM数据一个例子·············································…6

参考文献………·…10

GB/T30541-2014/ISO22938:2008

目U昌

本标准按照GB/T1.12009给出的规则起草。

本标准使用翻译法等同采用ISO22938:2008《文档管理电子内容/文档管理CCDM)数据交换格

式》(英文版)。

与本标准中规范性引用的国际文件有一致性对应关系的我国文件如下:

•-GB/T202252006电子成像词汇(ISO12651:1999,MOD)

本标准由全国文献影像技术标准化技术委员会CSAC/TC86)提出并归口。

本标准由全国文献影像技术标准化技术委员会第五分委员会起草。

本标准主要起草人:杨吉江、程真、薛四新、徐周亚。

I

GB/T30541-2014/ISO22938:2008

~I

本标准指定了一个用于数据交换的一致性格式,这些数据包含在电子内容/文档管理(Content/

DocumentManagement,CDM)系统中,包括文档及其相关的资源,以及由系统保存或管理的检索索引

值。这样的标准宜便于CDM数据的准确交换,也就是说,标准不宜要求数据被进行不可逆的修改或封

装进一个不允许对原始数据重构的格式中。因此,本标准没有选择一个特定的数据格式并将其指定作

CDM的交换标准。相反,本标准指定了一个通用的标记格式,该格式基于XML(ExtensibleMarkup

Language,可扩展标记语言),其中封装了所有形式的CDM数据。DTD(DocumentTypeDefinition,文

档类型定义)描述了用来进行CDM数据转换的XML标记。XML格式是W3CC万维网协会)1998年2

月采用的标准。XML是可扩展的,从而适当更新DTD可以很容易指定更多的CDM格式。

本标准旨在以一种让内容/文档管理系统的使用者和厂商都受益的方式来定义内容交换标准。某

些可能的益处如下:

1)文档信息能从一个遵循标准的CDM系统导出至另一个遵循标准的CDM系统。

2)企业内的不同CDM系统之间(因为自行选择、置换或者合并/采集等原因)将能够交换或整合

CDM信息。

本标准的界定本着这样的目标:在过于约束和过于笼统之间寻求一个平衡点。本标准宜足够宽泛

以包括所有常见以及预期将来可能出现的CDM信息类型和CDM系统。另一方面,本标准还宜有足够

的限制,从而使得CDM厂商在遵循标准时没有太大的困难。

II

GB/T30541-2014/ISO22938:2008

文献管理电子内容/文档管理(CDM)数据交换格式

1范围

本标准定义了内容/文档管理(Content/DocumentManagement,CDM)数据的交换以及相关的

资源。

2规范性引用文件

下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文

件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

ISO12651电子成像词汇表(ElectronicimagingVocabulary)

3术语和定义

ISO12651界定的以及下列术语和定义适用于本文件。

3.1

文档document

包含信息内容和相关元数据的XML流。

3.2

呈现rendition

页面内容的电子编码。

4符号和缩略语

下列符号和缩略语适用于本文件。

CDM内容/文档管理(Content/DocumentManagement)

DTD文档类型定义(DocumentTypeDefinition)

W3C万维网协会(WorldWideWebConsortium)

WWW万维网(WorldWideWeb)

XML可扩展标记语言(ExtensibleMarkupLanguage)

5基于XML的数据交换格式

5.1概述

电子文档的文档交换格式是XML的一个应用。XML是可扩展的、灵活的、独立于平台的格式,已

经被W3C作为标准来采用CW3C的术语里正式表述为“推荐勺。

本标准的主要用途是在不同文档管理系统间还没有合适交换方法时交换数据。本标准可以看作是

开发其他基于XML交换标准的基础平台,从而确保在整个文档管理领域有一个通用的框架。

GB/T30541-2014/ISO22938:2008

5.2XML用于内容/文挡管理数据

5.2.1XML结构概述

XML由标记和数据组成。标记由元素标签(通常是成对出现的)组成,这些标签可能包含称为属

性的描述性数据。数据是存在于元素对之间的非标记内容。元素可以嵌套,从而一个元素可包含子元

素,子元素还可以包含子子元素,以此类推。

本标准对元素、元素结构、元素属性给出了合适的定义,从而使得各种形式的CDM数据、资源、索

引值等,可以清晰且无歧义地描述出来并作为数据包含进来。描述这个的模型就是一个XMLDTD。

精确的DTD是本标准基本的内容。

5.2.2内容/文档管理(CDM)一一特定XML结构一-DTD

图1和图2描述了创建DTD的高层模型。其中元素及它们的含义如下:

a)内容/文档管理交换(cdm_interchange)

XML应用的名称,或者DTDO

b)内容/文档管理集合(cdm_collection)

包含在XML里的文档集合。它由一个名称,一组面向集合的索引值和一组文档组成。

c)索引域(index_field)

本元素引用索引名称、索引描述和索引内容元素。任何索引集元素应至少包含一个索引域

元素。

d)索引记录(index_record)

本元素把多个索引域条目组织成一个逻辑组。

e)文档(cdm_doc)

本元素包含一个元数据索引集及一个文档内容(doc_content)。

f)文档内容(doc_content)

本元素定义文档内容,该文档作为CDM交换操作的一部分传递。每个文档内容(doc_

content)应包含一个或多个呈现(rendition)。

g)呈现(rendition)

本元素定义了“呈现”(若有的话),及其属性。呈现(rendition)包含内容(content)和资源数据

(rsrc_data)元素。这些元素用来提供一种为每个呈现(rendition)定义访问方法(access_

method),编码(encoding)和压缩(compression)的方法。其中,访问方法(access_method)是

必须有,编码(encoding)和压缩(compression)属性则可选。所支持的访问方法(access_

method)包括Base64、URI和MIME。

h)资源数据(rsrc_data)

本元素封装了每个呈现(rendition)内的CDM资源数据。位图和字体是资源数据典型的例

子,它们是用来呈现所包含文档的。

1)标注(annotations)

本元素为一个呈现(rendition)封装了与标注相关的信息。标注(annotation)是由厂商定义的

知识流。某些厂商强调信息,另一些则强调二进制大对象类型(blobs)、位图或数据文件。标

注(annotation)的知识内容是因具体厂商而不同的。

j)内容(content)

本元素提供信息,这些信息与必备的存取方法(accessmethod)、数据的编码(encoding)形式和

压缩(compression)技术相关。

2

GB/T30541-2014/ISO22938:2008

k)索引名称(index_name)

本元素提供和索引元素记录属性相关联的名称。

1)记录属性(recordattributes)

本元素提供索引记录的名称和描述。

rn)索引描述(index_description)

本元素允许包含一个无约束文本的描述。该描述与因信息存档目的而建立的索引相关联。

n)索引内容(indexcontent)

本元素包含索引的值。

cdminterchange

(内容J文档管理交换〉

cdmcollect1on

(内容f文档管理集合)

集合索寻|

(见图2)

+

*

cdmdoc

文档索引

(文档)

(见图2)

doccontent

(文档内容)

+

rendition

(呈现)

+

content

(内容)

*

rsrcdata

(资源数据)

推荐标准

相似标准推荐

更多>