- 您的位置:
- 标准下载网 >>
- 标准分类 >>
- 国家标准(GB) >>
- GB/T 20533-2006 生态科学数据数据

【国家标准(GB)】 生态科学数据数据
本网站 发布时间:
2025-01-10 22:29:17
- GB/T20533-2006
- 现行
标准号:
GB/T 20533-2006
标准名称:
生态科学数据数据
标准类别:
国家标准(GB)
英文名称:
Metadata for ecological data标准状态:
现行-
发布日期:
2006-09-18 -
实施日期:
2007-03-01 出版语种:
简体中文下载格式:
.rar.pdf下载大小:
60.30 MB

点击下载
标准简介:
标准下载解压密码:www.bzxz.net
本标准定义了一个在数据集层次上描述生态科学数据的概念模型,提供了对该模型的形式化描述;规定了构成该模型的一组必选的、条件必选的和可选的数据子集、数据实体和数据素,各种需求层次的数据应用所需要的最小数据素集,以及为满足特殊需求对数据进行扩展和制定数据应用专规的规则和方法。 GB/T 20533-2006 生态科学数据数据 GB/T20533-2006
本标准定义了一个在数据集层次上描述生态科学数据的概念模型,提供了对该模型的形式化描述;规定了构成该模型的一组必选的、条件必选的和可选的数据子集、数据实体和数据素,各种需求层次的数据应用所需要的最小数据素集,以及为满足特殊需求对数据进行扩展和制定数据应用专规的规则和方法。

部分标准内容:
ICS35.240
中华人民共和国国家标准
GB/T20533—2006免费标准bzxz.net
生态科学数据元数据
Metadataforecologicaldata
2006-09-18发布
中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员会
2007-03-01实施
GB/T20533—2006
前言·
引言·
1范围
规范性应用文件
术语和定义
符号和缩略语·
缩略语·
UMI.模型符号
UMI.模型关系:
UML模型构造型:
一致性
元数据基本属性
UML模型图
XML、Schema和名称空间
数据字典
7 要求·
生态科学数据对元数据的要求·元数据包
元数据<<数据类型>>
生态科学数据核心元数据·
元数据扩展和元数据应用专规·7.6'
元数据应用专规示例
元数据实施
8元数据模式
8.1元数据包
8.2元数据<<数据类型>>
附录A(规范性附录)
附录B(规范性附录)
附录C(规范性附录)
附录D(规范性附录)
附录E(规范性附录)
附录F(资料性附录)
附录G(资料性附录)
附录H(资料性附录)
参考文献·
数据字典
元数据扩展和元数据应用专规
抽象测试套件
数据集全集元数据应用专规
核心元数据·
元数据应用专规示例·
元数据应用专规制定方法
元数据实施
GB/T20533—2006
本标准的附录A、附录B、附录C、附录D和附录E为规范性附录,附录F、附录G和附录H为资料性附录。
本标准由中国科学院“科学数据库及其应用系统”和“中国生态系统研究网络”支持编制。本标准由中国科学院提出。
本标准由全国信息分类编码标准化技术委员会归口。本标准起草单位:中国科学院计算机网络信息中心、中国科学院地理科学与资源研究所、中国科学院南京土壤研究所、中国科学院·水利部水土保持研究所、中国科学院寒区旱区环境与工程研究所、中国科学院·水利部成都山地灾害与环境研究所、中国科学院东北地理与农业生态研究所。本标准主要起草人:黎建辉、肖云、于贵瑞、侯艳飞、胡良霖、施建平、何洪林、董济农、郭明航、虞路清、张耀南、陈斌如、赵军、王闰强、刘宁、高美荣。本标准为第一次制定。
GB/T20533—2006
伴随着人类对人与自然协调发展重要性认识的加深,生态学受到越来越多的关注,并成为当前科学研究的热点学科。现代科学研究的一个特点是数据成为科学研究和科学发现的重要基础,在生态学领域亦是如此。
随着生态科学研究的发展和信息技术的进步,生态科学数据在迅速增长。然而目前与此并存的另一现象是,科研人员在实际的研究工作中往往感觉到所需数据的匮乏。很多时候,这种乏并不是因为所需的数据尚不存在,而在于这些数据难以发现、难以获取和缺乏可用性。这也是我国及其他很多国家大力开展和推进科学数据共享活动的缘起。在造成上述不协调现象的诸多因素中,元数据的缺乏和不规范是制约科研人员发现、管理和使用生态科学数据的主要原因之一,元数据是关于数据的数据,用于说明数据的内容、品质、产生过程和背景、访问和获取方式以及其他有关特征。从数据的使用来看:a)数据生产者可能在数据产生很长时间之后去使用或重用它们;b)数据的生产者并非总是数据的使用者,数据生产者以外的人员使用数据的求日益强烈,尤其是对长时间序列、大尺度和综合性生态研究来说,这样的需求更显而易见。适当的元数据能帮助数据生产者以及数据生产者以外的用户更快地发现所需要的数据,更好地了解其内容和限制,评估其对于应用需求的适用性,并恰当地获取和使用它们。同时,由于数据生产者和用户都需要处理越来越多的数据,元数据能为他们提供关于这些数据的关键知识,帮助其有效地保存、管理和维护这些数据,提高效率,且使数据生产单位能够不受人员变动的影响,防止数据资产的流失,维护单位和国家的有关投资。
另外,在生态科学数据中,很多数据特别是观测数据的产生具有不可重复性,为保证它们不被误用和在将来可用,尤其需要详细地说明数据产生的方法和条件。元数据允许数据生产者对这些信息进行完全的记录,以便这些数据不因时间的流逝而丧失可用性。本标准的目的是提供一个可扩展的、用于描述和归档管理生态科学数据的概念数据模型。该模型将生态科学数据的特征归纳为10类:标识信息、数据质量信息、方法信息、场地信息、项目信息、分发信息、元数据参考信息、实体信息、空间参照系信息和空间表示信息。本标准的实施将促进生态科学数据的高效保存、管理和维护,促进它们为科研人员、其他用户或者软件程序等的检索、评价、获取和使用,促进生态科学数据的共享和交换。1范围
生态科学数据元数据
GB/T20533—2006
本标准定义了一个在数据集层次上描述生态科学数据的概念模型,规定了构成该模型的一组必选的、条件必选的和可选的元数据子集、元数据实体和元数据元素,提供了对该模型的形式化描述。本标准还规定了各种需求层次的元数据应用所需要的最小元数据元索集(简称为核心元数据),以及规定了为满足特殊需求对元数据进行扩展和制定元数据应用专规的规则和方法。本标推中的生态科学数据包括生态观测、调查、试验等生态科学研究活动中所产生的原始基本数据,也包括根据科研需求对原始基本数据进行加工整理面形成的数据,既可以是数字化的,也可以是非数字化的。
本标准适用于生态科学数据集和数据集系列的编目和描述、数据集和数据集系列的组织管理,也可用于数据交换中心的数据服务,本标准期望为生态科学数据生产者、数据管理者、数据管理系统分析和设计人员以及与数据生产、组织管理、服务或使用有关的其他人员所使用,以便理解生态科学数据元数据标推化的基本原理和总体要求。尽管本标准主要用专生态科学数据集,但其原理可以扩展到其他领域的科学数据资源。通过定义一个通用的概念模型,本标准保证各元数据实施之间有较高程度的语义至操作性,但是本标准并没有规定元数据在一个信息系统中具体如何实施。2规范性应用文件·
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注期的引用文件,其最新版本适用于本标准。GB/T2659世界各国和地区名称代码(GB/T2659.-2000,eqvISO3166-1:1997)GB3102.1-1993空间和时间的量和单位(eqvISO31-1:1992)GB/T4880-1991语种名称代码(eqvISO639:1988)GB/T7408一1994数据元和交换格式信息交换日期和时间表示法(eqvISO8601:1988)GB/T7714—2005文后参考文献著录规则(ISO690:1987,Documentation-·Bibliographicreferences--Content,form and struesure;ISO 690-2:1997,Information and documentation-Bibliographicreferences—Part 2: Electronic documents or parts thereof,NEQ)GB/T18391.3一2001信息技术数据元的规范与标准化第3部分:数据元的基本属性(idtISO/IEC11179-3:1994)
GB/T19710—2005地理信息完数据(ISO19115:2003,M()D)ISO/IEC19501:2005信息技术一开放的分布式处理一统一建模语育(UML)Version1.4.2W3CRecommendationXMLSchema1.1:20043术语和定义
下列术语和定义适用于本标准。3.1
列表型数据tabulardata
以表格或类表格形式存在的数据。1
GB/T20533—2006
栅格数据
rasterdata
按栅格单元的行和列排列的、有不同灰度值或颜色的阵列数据。3.3
量数据
vectordata
以坐标串表示的空间点、线、面等几何数据及与其相联系的有关属性数据的总称。3.4
数据集
dataset
可以识别的数据集合。
注1:通过对诸如覆盖范围或者属性类型的限制,数据集在物理上可以是更大数据集中的一个比较小的数据组。注2:改写GB/T19710—2005.定义4.2。3.5
数据集系列
dataset series
符合相同产品规范的数据集的集合。[GB/T19710—2005,定义4.3]
数据实体
dataentity
包含数据内容的一个逻辑的或物理的存储单元。例如,文本文件、关系数据库数据表、电子表格、GIS图层等。注:一个数据集可能由一个或多个数据实体组成。3.7
元数据
metadata
定义和描述其他数据的数据。
[GB/T18391.1,定义3.41]
元数据实例
metadata instance
与某一元数据模式相符的某一具体数据资源的元数据。3.9
元数据元素
metadata element
元数据的基本单元。
[GB/T19710—2005,定义4.6]注1:与UMIL术语中的属性同义。注2:元数据元素在元数据实体中是唯一的。3.10
metadata entity
元数据实体
一组说明数据相同特性的元数据元索。[GB/T197102005,定义4.7]
注1:可以包含一个或多个元数据实体。注2:与UMI.术语中的类同义。
metadata section
元数据子集
元数据的子集合,由相关的元数据实体和元索组成。[GB/T19710—2005,定义4.8]
注:与UML术语中的包同义。
metadataregistry
元数据注册系统
登记和发布元数据的语义、结构、交换格式等的权威信息的可公开访问的系统。元数据应用专规
metadataapplicationprofile
GB/T20533—2006
为特定应用定义的元数据元素、规则和指南的一个集合,这些元数据元素来自一个或多个已有的元数据标准,还可以包括用户自定义的元数据元素。3.14
encodingscheme
编码体系
提供语境信息或句法分析规则,以帮助对元数据元索的值进行解释的受控词表或者格式规范。注:编码体系包括词汇编码体系和句法编码体系。3.15
vocabulary encoding scheme
词汇编码体系
作为元数据元素值域的受控词表。例如,汉语主题词表、世界各国和地区名称代码表等。3.16
句法编码体系
syntaxencodingscheme
元数据元索的值在格式上遵从的正式表示法。例如,“2000-01-01”作为日期的标准表示。3.17
名称空间
namespace
名称的集合,以统一资源标识符(URI)标识。注:作为定义名称的语境,名称空间是解决不同来源的词汇之间的名称冲突问题的一种机制。3.18
datatype
数据类型
有效值域和充许对该值域内的值进行的合法操作的规定。例如,整型、实型、布尔型、学符审、日期以及本标准中自定义的数据类型等。注1:数据类型包括基本预定义类型和用户定义的类型。注2:数据类型用术语标识,例如整型。注3:改写GB/T19710-2005,定义4.1。3.19
valuedomain
允许值的集合。
概念模式
conceptualschema
概念模型的形式化描述,
conceptual model
概念模型
定义一个论域的概念上的模型。3.22
universeofdiscourse
一场讨论或辩论中所涉及的所有实体构成的范畴。3
GB/T20533—2006
模式schema
模型的形式化描述。
型model
对论域某些方面的抽象。
数据模型
data mode!
以反映信息结构的某种方式对数据组织的描述注:数据模型指明数据的属性、结构和内在关系。3.26
clearinghotse
数据交换中心
收集和发布数据资源的元数据,提供对分布式数据资源的统一聋询和定位的一站式服务系统。3.27
原resource
具有身份标识的任何对象。
例如,数据集、服务、人员或机构等。4
符号和缩略语
缩略语
4.2UML模型符号
超文本置标语言(HypertextMarkupLanguage)元数据应用专规(MetadataApplicationProfile)元数据注册系统(MetadataRegistry)标准通用置标语言(StandardGeneralizedMarkupLanguage)统一建模语言(UnifiedModelingLanguage)统一资源标识符(UniformResourceIndentifier)可扩展置标语言(ExtensibleMarkupLanguage)本标准采用统建模语言(UML)描述元数据子集、元数据实体和元数据元索之间的关系。用UML中的包表示元数据子集,类表示元数据实体,属性表示元数据元索。本标准中使用的主要UML符号如图1所示:
构造型
图1UML符号
GB/T20533—2006
UML图中的某一部分需要给出补充说明或明确的解释时,注释会很有用。可以把注释看成是图形化的黄页,补充性或解释性的文字写在表示注释的带折角矩形框中。注释和被注释的图元索之间用一条虚线“.---”连接。
4.3UML模型关系
a)关联
关联用于描述两个或更多类之间的一般关系。关联的方向必须说明。如果不指明方向,则假定为双向关联。如果是单向关联,关联方向可以在线段终点用箭头来标记。
b)聚合
聚合用于创建两个类之间的部分与整体的关系。在该关系中,一个类担当容器角色,另一个类担当容器的构件角色。聚集的表示法是从“部分”类通一条带空心菱形箭头的实线指向“整体”类。c)泛化
泛化表示父类(或超类)和可以替代它的子类之间的关系。父类是泛化类,而子类则定义为特化类。泛化的表示法是从子类画一条带空心三角箭头的实线指向父类。d)依赖
依赖用来表示对包(元数据子集)的理解、使用等依赖其他的包(元数据子集)。依赖的表示法是从依赖类画一条带箭头的虚线指向被依赖类。e)角色
两个类发生关联时,每个类通常在关联中都扮演着某种角色。UML模型中可以使用“角色名称”标明目标对象到源对象的关系。在双向关联中,将提供两个角色名称。图2说明了在UML图中如何表示角色名称和基数。
基数1 基数2
角色1角色2
图2UML角色
图2中,角色名称“角色1”是类1对类2的关系,“角色2”是类2对类1的关系,“基数1”表示类1有多少个对象和类2的单个对象关联,“基数2”表示类2有多少个对象和类1的单个对象关联。基数的取值可以是一个正整数n(例如,“1”、“2”、\3”),也可以是\0..n”、\0..*”、“n..*”、“m..n”(m小于n),还可以是\m,n”(m小于n)。其中,m和n都是一确定的正整数;\*\代表许多、多个;\..\在\o..*”、“n.,*\语境中表示\或”,例如,基数1为\0..*”表示类1的0个或多个对象与类2的1个对象关联,基数1为\1..*”表示类1的1个或多个对象与类2的1个对象关联;\.,”在\0..n”、“m..n”语境中表示“到”,例如,基数1为1..3”表示类1的1个、2个或3个对象与类2的1个对象关联;\,”表示\或”,例如,基数1为\2,4”表示类1的2个或4个对象与类2的1个对象关联。在单向关联中,一般只标注箭头指向的类的多少个对象与箭头背向的类的个对象关联。4.4UML模型构造型
UML构造型是现有UML概念的扩展机制。它是一种用来对其他UMI.元素进行分类(或标记)的模型元索。构造型在固有的UMI元模型类层次结构的基础上,增强了分类机制。本标推中使用如下构造型:
a)<>(<<类型>>):-个构造型类,用于定义实例(对象)的域以及作用于这些对象的操作。类型可以有属性和关联,但没有方法。<(<<数据类型>>):缺乏同一性、其操作没有负作用的一组值的描述符b)
数据类型包括基本预定义类型和用户定义类型。数据类型是·-个具有很少操作或没有操作的类,其主要目的是容纳另一个类的抽象状态,以进行传输、编码或持久地存储。c)<>(<<枚举>>):-种数据类型,其实例组成·个有名称的字符值的列5
GB/T20533—2006
表。枚举名称及其字符值均要声明。枚举意味荐一个类中的可能值完全已知。d)<>(<<代码表>>):用于描述更开放的枚举。它是一种灵活的枚举,用于表示可能值的一个长列表。如果该列表的元素是完全已知的,应当使用枚举;如果仅知道元素的可能值,则应使用代码表。即枚举是封闭的、不可扩展的,而代码表是可以扩展的。e)<>(<<抽象>>):抽象类,该类不能被直接实例化,UML模型中用斜体显示这个类的名称。
5一致性
本标准定义的元数据实体和元数据元索在第7章、第8章和附录A中阐明。用户制定的元数据应用专规按照附录B中的要求和规则定义和描述。一个声称与本标准严格一致的元数据应用专规只包含本标准中定义的元数据元紧、元数据实体和元数据子集,并应能通过附录C中所要求的测试。一个声称与本标准一致的元数据应用专规可包含扩展的元数据元素、元数据实体和元数据子集,并应能通过附录C中所要求的测试。6约定
6.1元数据基本属性
对于每个元数据元索和元数据实体,本标准从语义和语法两方面进行描述。具体来说,使用以下8个属性(基于GB/T18391.3一2001定义的有关属性)进行定义:a)中文名称
赋予元数据元紧或元数据实体的一个中文标记。元数据实体名称在本标准中是唯一的,元数据元索名称在元数据实体中是唯一的,通过元数据实体名称和元数据元素名称的组合,使元数据元索名称在整个标准中唯。
b)英文名称
元数据元素或元数据实体的英文名称,一般用英文全称。c)缩写名
元数据元素或元数据实体的英文缩写名称。缩写规则如下:1)缩写名在本标准范围内必须唯一。2)对存在国际或行业领域惯用英文名称缩写的,采用惯用缩写。d)定义
对元数据元索或元数据实体含义的解释,以使之与其他元数据元素或元数据实体在概念上相区别。e)数据类型
元数据元素的有效值域和允许对该值域内的值进行有效操作的规定,例如整型、实型、字符串型等。本标准也使用数据类型属性定义元数据实体、构造型和元数据关联。f)值域
元数据元索所允许的值的集合。本标准也使用值域属性定义元数据实体,用以说明该元数据实体包含的元数据元素和实体。
g)约束/条件
说明一个元数据实体或元数据元索是否应当总是在元数据中选用还是有时选用。该属性可以有如下的值:必选、条件必选、可选。其中,必选指必须选用或者说被强制选用;条件必选指当满足指定的条件时必须选用;可选指可以选用也可以不选用。元数据实体和元数据元素的约束/条件属性是一个条件性概念,即,一个元数据元索或实体必选还是可选是在其“上层”元数据实体已被(强制或非强制)选用的前提下而言的。
h)最大出现次数
说明元数据元素或元数据实体可以有的实例的最大数目。GB/T20533—2006
本标准第8章以UML静态结构图对元数据元索和元数据实体的语法特征进行说明。本标准附录A以数据字典的形式完整说明了每个元数据元素和元数据实体的以上8个属性。本标准附录D以XMLSchema语言提供了对元数据元素和元数据实体的数据类型、值域以及语法特征等的定义。6.2UML模型图
本标准使用UML抽象对象模型定义生态科学数据元数据的模型。在第8章提供的UML图中,每幅图定义由相关元数据实体、元素、数据类型和代码表构成的元数据子集(UML包),在其他图中定义的相关元数据实体的元索予以省略,并在元数据实体名称下圆括号内说明所在的包。6.1规定的8个属性中,反映语法特征的属性包括药束/条件和最大出现次数,而UMI,中类的属性的多重性以及类间关系的基数可以看作是元数据元索和元数据实体约束/条件属性和最大出现次数属性的一种体现。6.3XMLSchema和名称空间
本标准还使用XMLSchema语言对生态科学数据元数据进行定义。XMLSchema语言是万维网联盟(W3C)的一个推荐标准,能够清晰定义元数据元素和元数据实体的数据类型、值域以及元数据实体、元数据元素之间的关系。
名称空间使得不同来源的XML文件可以使用相同名称的元素,而且这些相同名称的元素可以无冲突地并入同一个XML文件中。由于本标准中定义的元数据实体和元数据元素可能在元数据应用专规中使用,为本标准定义的元数据元素和元数据实体声明一个名称空间是必要的。本标准的名称空间:
xmlns=\http://www.gb.cn/med/2005/terms本标准中还使用了以下两个名称空间缩写,分别针对XML、XMLSchema。XML的名称空间:
Xmlns:xml=\http://www.w3.org/XML/1998/namespaceXMLSchema的名称空间:
xmlns:xs=\http://www.w3.org/2001/XMLSchema\6.4数据字典
数据字典对每个元数据元素和元数据实体的中文名称、英文名称、缩写名、定义、数据类型、值域、约束/条件和最大出现次数等8个属性进行了完整说明。在数据字典中,角色名称用来标识元数据抽象模型关联,并由“角色名称:”开头,将它们与其他元数据元紫区分;对于元数据实体的值域,用其包含的行数来说明;也使用数据类型属性定义元数据实体、构造型和关联;对于元数据元素和元数据实体的约束/条件属性,用“M”表示必选,“C”表示条件必选、“O”表示可选;对于元数据元素和元数据实体的最大出现次数,只出现一次用“1”表示,不固定次数的重复出现用“N”表示,允许不为1的固定出现次数,并用相应的数字(即“2”、“3”、…)表示。7要求
7.1生态科学数据对元数据的要求本标准定义描述生态科学数据所需要的元数据。元数据可以应用于独立的数据集,也可应用于数据集系列。应当为生态科学数据集提供元数据,也可为生态科学数据集系列提供元数据。图3定义生态科学数据集、数据集系列和元数据之间的关系。它规定一个数据集应有一个或多个相关的元数据实例。数据集可以聚合为数据集系列,也应为数据集系列提供元数据。元数据由一个或多个元数据子集(UML包)组成,一个元数据子集包含一个或多个元数据实体(UMI.类)。7
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。
中华人民共和国国家标准
GB/T20533—2006免费标准bzxz.net
生态科学数据元数据
Metadataforecologicaldata
2006-09-18发布
中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员会
2007-03-01实施
GB/T20533—2006
前言·
引言·
1范围
规范性应用文件
术语和定义
符号和缩略语·
缩略语·
UMI.模型符号
UMI.模型关系:
UML模型构造型:
一致性
元数据基本属性
UML模型图
XML、Schema和名称空间
数据字典
7 要求·
生态科学数据对元数据的要求·元数据包
元数据<<数据类型>>
生态科学数据核心元数据·
元数据扩展和元数据应用专规·7.6'
元数据应用专规示例
元数据实施
8元数据模式
8.1元数据包
8.2元数据<<数据类型>>
附录A(规范性附录)
附录B(规范性附录)
附录C(规范性附录)
附录D(规范性附录)
附录E(规范性附录)
附录F(资料性附录)
附录G(资料性附录)
附录H(资料性附录)
参考文献·
数据字典
元数据扩展和元数据应用专规
抽象测试套件
数据集全集元数据应用专规
核心元数据·
元数据应用专规示例·
元数据应用专规制定方法
元数据实施
GB/T20533—2006
本标准的附录A、附录B、附录C、附录D和附录E为规范性附录,附录F、附录G和附录H为资料性附录。
本标准由中国科学院“科学数据库及其应用系统”和“中国生态系统研究网络”支持编制。本标准由中国科学院提出。
本标准由全国信息分类编码标准化技术委员会归口。本标准起草单位:中国科学院计算机网络信息中心、中国科学院地理科学与资源研究所、中国科学院南京土壤研究所、中国科学院·水利部水土保持研究所、中国科学院寒区旱区环境与工程研究所、中国科学院·水利部成都山地灾害与环境研究所、中国科学院东北地理与农业生态研究所。本标准主要起草人:黎建辉、肖云、于贵瑞、侯艳飞、胡良霖、施建平、何洪林、董济农、郭明航、虞路清、张耀南、陈斌如、赵军、王闰强、刘宁、高美荣。本标准为第一次制定。
GB/T20533—2006
伴随着人类对人与自然协调发展重要性认识的加深,生态学受到越来越多的关注,并成为当前科学研究的热点学科。现代科学研究的一个特点是数据成为科学研究和科学发现的重要基础,在生态学领域亦是如此。
随着生态科学研究的发展和信息技术的进步,生态科学数据在迅速增长。然而目前与此并存的另一现象是,科研人员在实际的研究工作中往往感觉到所需数据的匮乏。很多时候,这种乏并不是因为所需的数据尚不存在,而在于这些数据难以发现、难以获取和缺乏可用性。这也是我国及其他很多国家大力开展和推进科学数据共享活动的缘起。在造成上述不协调现象的诸多因素中,元数据的缺乏和不规范是制约科研人员发现、管理和使用生态科学数据的主要原因之一,元数据是关于数据的数据,用于说明数据的内容、品质、产生过程和背景、访问和获取方式以及其他有关特征。从数据的使用来看:a)数据生产者可能在数据产生很长时间之后去使用或重用它们;b)数据的生产者并非总是数据的使用者,数据生产者以外的人员使用数据的求日益强烈,尤其是对长时间序列、大尺度和综合性生态研究来说,这样的需求更显而易见。适当的元数据能帮助数据生产者以及数据生产者以外的用户更快地发现所需要的数据,更好地了解其内容和限制,评估其对于应用需求的适用性,并恰当地获取和使用它们。同时,由于数据生产者和用户都需要处理越来越多的数据,元数据能为他们提供关于这些数据的关键知识,帮助其有效地保存、管理和维护这些数据,提高效率,且使数据生产单位能够不受人员变动的影响,防止数据资产的流失,维护单位和国家的有关投资。
另外,在生态科学数据中,很多数据特别是观测数据的产生具有不可重复性,为保证它们不被误用和在将来可用,尤其需要详细地说明数据产生的方法和条件。元数据允许数据生产者对这些信息进行完全的记录,以便这些数据不因时间的流逝而丧失可用性。本标准的目的是提供一个可扩展的、用于描述和归档管理生态科学数据的概念数据模型。该模型将生态科学数据的特征归纳为10类:标识信息、数据质量信息、方法信息、场地信息、项目信息、分发信息、元数据参考信息、实体信息、空间参照系信息和空间表示信息。本标准的实施将促进生态科学数据的高效保存、管理和维护,促进它们为科研人员、其他用户或者软件程序等的检索、评价、获取和使用,促进生态科学数据的共享和交换。1范围
生态科学数据元数据
GB/T20533—2006
本标准定义了一个在数据集层次上描述生态科学数据的概念模型,规定了构成该模型的一组必选的、条件必选的和可选的元数据子集、元数据实体和元数据元素,提供了对该模型的形式化描述。本标准还规定了各种需求层次的元数据应用所需要的最小元数据元索集(简称为核心元数据),以及规定了为满足特殊需求对元数据进行扩展和制定元数据应用专规的规则和方法。本标推中的生态科学数据包括生态观测、调查、试验等生态科学研究活动中所产生的原始基本数据,也包括根据科研需求对原始基本数据进行加工整理面形成的数据,既可以是数字化的,也可以是非数字化的。
本标准适用于生态科学数据集和数据集系列的编目和描述、数据集和数据集系列的组织管理,也可用于数据交换中心的数据服务,本标准期望为生态科学数据生产者、数据管理者、数据管理系统分析和设计人员以及与数据生产、组织管理、服务或使用有关的其他人员所使用,以便理解生态科学数据元数据标推化的基本原理和总体要求。尽管本标准主要用专生态科学数据集,但其原理可以扩展到其他领域的科学数据资源。通过定义一个通用的概念模型,本标准保证各元数据实施之间有较高程度的语义至操作性,但是本标准并没有规定元数据在一个信息系统中具体如何实施。2规范性应用文件·
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注期的引用文件,其最新版本适用于本标准。GB/T2659世界各国和地区名称代码(GB/T2659.-2000,eqvISO3166-1:1997)GB3102.1-1993空间和时间的量和单位(eqvISO31-1:1992)GB/T4880-1991语种名称代码(eqvISO639:1988)GB/T7408一1994数据元和交换格式信息交换日期和时间表示法(eqvISO8601:1988)GB/T7714—2005文后参考文献著录规则(ISO690:1987,Documentation-·Bibliographicreferences--Content,form and struesure;ISO 690-2:1997,Information and documentation-Bibliographicreferences—Part 2: Electronic documents or parts thereof,NEQ)GB/T18391.3一2001信息技术数据元的规范与标准化第3部分:数据元的基本属性(idtISO/IEC11179-3:1994)
GB/T19710—2005地理信息完数据(ISO19115:2003,M()D)ISO/IEC19501:2005信息技术一开放的分布式处理一统一建模语育(UML)Version1.4.2W3CRecommendationXMLSchema1.1:20043术语和定义
下列术语和定义适用于本标准。3.1
列表型数据tabulardata
以表格或类表格形式存在的数据。1
GB/T20533—2006
栅格数据
rasterdata
按栅格单元的行和列排列的、有不同灰度值或颜色的阵列数据。3.3
量数据
vectordata
以坐标串表示的空间点、线、面等几何数据及与其相联系的有关属性数据的总称。3.4
数据集
dataset
可以识别的数据集合。
注1:通过对诸如覆盖范围或者属性类型的限制,数据集在物理上可以是更大数据集中的一个比较小的数据组。注2:改写GB/T19710—2005.定义4.2。3.5
数据集系列
dataset series
符合相同产品规范的数据集的集合。[GB/T19710—2005,定义4.3]
数据实体
dataentity
包含数据内容的一个逻辑的或物理的存储单元。例如,文本文件、关系数据库数据表、电子表格、GIS图层等。注:一个数据集可能由一个或多个数据实体组成。3.7
元数据
metadata
定义和描述其他数据的数据。
[GB/T18391.1,定义3.41]
元数据实例
metadata instance
与某一元数据模式相符的某一具体数据资源的元数据。3.9
元数据元素
metadata element
元数据的基本单元。
[GB/T19710—2005,定义4.6]注1:与UMIL术语中的属性同义。注2:元数据元素在元数据实体中是唯一的。3.10
metadata entity
元数据实体
一组说明数据相同特性的元数据元索。[GB/T197102005,定义4.7]
注1:可以包含一个或多个元数据实体。注2:与UMI.术语中的类同义。
metadata section
元数据子集
元数据的子集合,由相关的元数据实体和元索组成。[GB/T19710—2005,定义4.8]
注:与UML术语中的包同义。
metadataregistry
元数据注册系统
登记和发布元数据的语义、结构、交换格式等的权威信息的可公开访问的系统。元数据应用专规
metadataapplicationprofile
GB/T20533—2006
为特定应用定义的元数据元素、规则和指南的一个集合,这些元数据元素来自一个或多个已有的元数据标准,还可以包括用户自定义的元数据元素。3.14
encodingscheme
编码体系
提供语境信息或句法分析规则,以帮助对元数据元索的值进行解释的受控词表或者格式规范。注:编码体系包括词汇编码体系和句法编码体系。3.15
vocabulary encoding scheme
词汇编码体系
作为元数据元素值域的受控词表。例如,汉语主题词表、世界各国和地区名称代码表等。3.16
句法编码体系
syntaxencodingscheme
元数据元索的值在格式上遵从的正式表示法。例如,“2000-01-01”作为日期的标准表示。3.17
名称空间
namespace
名称的集合,以统一资源标识符(URI)标识。注:作为定义名称的语境,名称空间是解决不同来源的词汇之间的名称冲突问题的一种机制。3.18
datatype
数据类型
有效值域和充许对该值域内的值进行的合法操作的规定。例如,整型、实型、布尔型、学符审、日期以及本标准中自定义的数据类型等。注1:数据类型包括基本预定义类型和用户定义的类型。注2:数据类型用术语标识,例如整型。注3:改写GB/T19710-2005,定义4.1。3.19
valuedomain
允许值的集合。
概念模式
conceptualschema
概念模型的形式化描述,
conceptual model
概念模型
定义一个论域的概念上的模型。3.22
universeofdiscourse
一场讨论或辩论中所涉及的所有实体构成的范畴。3
GB/T20533—2006
模式schema
模型的形式化描述。
型model
对论域某些方面的抽象。
数据模型
data mode!
以反映信息结构的某种方式对数据组织的描述注:数据模型指明数据的属性、结构和内在关系。3.26
clearinghotse
数据交换中心
收集和发布数据资源的元数据,提供对分布式数据资源的统一聋询和定位的一站式服务系统。3.27
原resource
具有身份标识的任何对象。
例如,数据集、服务、人员或机构等。4
符号和缩略语
缩略语
4.2UML模型符号
超文本置标语言(HypertextMarkupLanguage)元数据应用专规(MetadataApplicationProfile)元数据注册系统(MetadataRegistry)标准通用置标语言(StandardGeneralizedMarkupLanguage)统一建模语言(UnifiedModelingLanguage)统一资源标识符(UniformResourceIndentifier)可扩展置标语言(ExtensibleMarkupLanguage)本标准采用统建模语言(UML)描述元数据子集、元数据实体和元数据元索之间的关系。用UML中的包表示元数据子集,类表示元数据实体,属性表示元数据元索。本标准中使用的主要UML符号如图1所示:
构造型
图1UML符号
GB/T20533—2006
UML图中的某一部分需要给出补充说明或明确的解释时,注释会很有用。可以把注释看成是图形化的黄页,补充性或解释性的文字写在表示注释的带折角矩形框中。注释和被注释的图元索之间用一条虚线“.---”连接。
4.3UML模型关系
a)关联
关联用于描述两个或更多类之间的一般关系。关联的方向必须说明。如果不指明方向,则假定为双向关联。如果是单向关联,关联方向可以在线段终点用箭头来标记。
b)聚合
聚合用于创建两个类之间的部分与整体的关系。在该关系中,一个类担当容器角色,另一个类担当容器的构件角色。聚集的表示法是从“部分”类通一条带空心菱形箭头的实线指向“整体”类。c)泛化
泛化表示父类(或超类)和可以替代它的子类之间的关系。父类是泛化类,而子类则定义为特化类。泛化的表示法是从子类画一条带空心三角箭头的实线指向父类。d)依赖
依赖用来表示对包(元数据子集)的理解、使用等依赖其他的包(元数据子集)。依赖的表示法是从依赖类画一条带箭头的虚线指向被依赖类。e)角色
两个类发生关联时,每个类通常在关联中都扮演着某种角色。UML模型中可以使用“角色名称”标明目标对象到源对象的关系。在双向关联中,将提供两个角色名称。图2说明了在UML图中如何表示角色名称和基数。
基数1 基数2
角色1角色2
图2UML角色
图2中,角色名称“角色1”是类1对类2的关系,“角色2”是类2对类1的关系,“基数1”表示类1有多少个对象和类2的单个对象关联,“基数2”表示类2有多少个对象和类1的单个对象关联。基数的取值可以是一个正整数n(例如,“1”、“2”、\3”),也可以是\0..n”、\0..*”、“n..*”、“m..n”(m小于n),还可以是\m,n”(m小于n)。其中,m和n都是一确定的正整数;\*\代表许多、多个;\..\在\o..*”、“n.,*\语境中表示\或”,例如,基数1为\0..*”表示类1的0个或多个对象与类2的1个对象关联,基数1为\1..*”表示类1的1个或多个对象与类2的1个对象关联;\.,”在\0..n”、“m..n”语境中表示“到”,例如,基数1为1..3”表示类1的1个、2个或3个对象与类2的1个对象关联;\,”表示\或”,例如,基数1为\2,4”表示类1的2个或4个对象与类2的1个对象关联。在单向关联中,一般只标注箭头指向的类的多少个对象与箭头背向的类的个对象关联。4.4UML模型构造型
UML构造型是现有UML概念的扩展机制。它是一种用来对其他UMI.元素进行分类(或标记)的模型元索。构造型在固有的UMI元模型类层次结构的基础上,增强了分类机制。本标推中使用如下构造型:
a)<
数据类型包括基本预定义类型和用户定义类型。数据类型是·-个具有很少操作或没有操作的类,其主要目的是容纳另一个类的抽象状态,以进行传输、编码或持久地存储。c)<
GB/T20533—2006
表。枚举名称及其字符值均要声明。枚举意味荐一个类中的可能值完全已知。d)<
5一致性
本标准定义的元数据实体和元数据元索在第7章、第8章和附录A中阐明。用户制定的元数据应用专规按照附录B中的要求和规则定义和描述。一个声称与本标准严格一致的元数据应用专规只包含本标准中定义的元数据元紧、元数据实体和元数据子集,并应能通过附录C中所要求的测试。一个声称与本标准一致的元数据应用专规可包含扩展的元数据元素、元数据实体和元数据子集,并应能通过附录C中所要求的测试。6约定
6.1元数据基本属性
对于每个元数据元索和元数据实体,本标准从语义和语法两方面进行描述。具体来说,使用以下8个属性(基于GB/T18391.3一2001定义的有关属性)进行定义:a)中文名称
赋予元数据元紧或元数据实体的一个中文标记。元数据实体名称在本标准中是唯一的,元数据元索名称在元数据实体中是唯一的,通过元数据实体名称和元数据元素名称的组合,使元数据元索名称在整个标准中唯。
b)英文名称
元数据元素或元数据实体的英文名称,一般用英文全称。c)缩写名
元数据元素或元数据实体的英文缩写名称。缩写规则如下:1)缩写名在本标准范围内必须唯一。2)对存在国际或行业领域惯用英文名称缩写的,采用惯用缩写。d)定义
对元数据元索或元数据实体含义的解释,以使之与其他元数据元素或元数据实体在概念上相区别。e)数据类型
元数据元素的有效值域和允许对该值域内的值进行有效操作的规定,例如整型、实型、字符串型等。本标准也使用数据类型属性定义元数据实体、构造型和元数据关联。f)值域
元数据元索所允许的值的集合。本标准也使用值域属性定义元数据实体,用以说明该元数据实体包含的元数据元素和实体。
g)约束/条件
说明一个元数据实体或元数据元索是否应当总是在元数据中选用还是有时选用。该属性可以有如下的值:必选、条件必选、可选。其中,必选指必须选用或者说被强制选用;条件必选指当满足指定的条件时必须选用;可选指可以选用也可以不选用。元数据实体和元数据元素的约束/条件属性是一个条件性概念,即,一个元数据元索或实体必选还是可选是在其“上层”元数据实体已被(强制或非强制)选用的前提下而言的。
h)最大出现次数
说明元数据元素或元数据实体可以有的实例的最大数目。GB/T20533—2006
本标准第8章以UML静态结构图对元数据元索和元数据实体的语法特征进行说明。本标准附录A以数据字典的形式完整说明了每个元数据元素和元数据实体的以上8个属性。本标准附录D以XMLSchema语言提供了对元数据元素和元数据实体的数据类型、值域以及语法特征等的定义。6.2UML模型图
本标准使用UML抽象对象模型定义生态科学数据元数据的模型。在第8章提供的UML图中,每幅图定义由相关元数据实体、元素、数据类型和代码表构成的元数据子集(UML包),在其他图中定义的相关元数据实体的元索予以省略,并在元数据实体名称下圆括号内说明所在的包。6.1规定的8个属性中,反映语法特征的属性包括药束/条件和最大出现次数,而UMI,中类的属性的多重性以及类间关系的基数可以看作是元数据元索和元数据实体约束/条件属性和最大出现次数属性的一种体现。6.3XMLSchema和名称空间
本标准还使用XMLSchema语言对生态科学数据元数据进行定义。XMLSchema语言是万维网联盟(W3C)的一个推荐标准,能够清晰定义元数据元素和元数据实体的数据类型、值域以及元数据实体、元数据元素之间的关系。
名称空间使得不同来源的XML文件可以使用相同名称的元素,而且这些相同名称的元素可以无冲突地并入同一个XML文件中。由于本标准中定义的元数据实体和元数据元素可能在元数据应用专规中使用,为本标准定义的元数据元素和元数据实体声明一个名称空间是必要的。本标准的名称空间:
xmlns=\http://www.gb.cn/med/2005/terms本标准中还使用了以下两个名称空间缩写,分别针对XML、XMLSchema。XML的名称空间:
Xmlns:xml=\http://www.w3.org/XML/1998/namespaceXMLSchema的名称空间:
xmlns:xs=\http://www.w3.org/2001/XMLSchema\6.4数据字典
数据字典对每个元数据元素和元数据实体的中文名称、英文名称、缩写名、定义、数据类型、值域、约束/条件和最大出现次数等8个属性进行了完整说明。在数据字典中,角色名称用来标识元数据抽象模型关联,并由“角色名称:”开头,将它们与其他元数据元紫区分;对于元数据实体的值域,用其包含的行数来说明;也使用数据类型属性定义元数据实体、构造型和关联;对于元数据元素和元数据实体的约束/条件属性,用“M”表示必选,“C”表示条件必选、“O”表示可选;对于元数据元素和元数据实体的最大出现次数,只出现一次用“1”表示,不固定次数的重复出现用“N”表示,允许不为1的固定出现次数,并用相应的数字(即“2”、“3”、…)表示。7要求
7.1生态科学数据对元数据的要求本标准定义描述生态科学数据所需要的元数据。元数据可以应用于独立的数据集,也可应用于数据集系列。应当为生态科学数据集提供元数据,也可为生态科学数据集系列提供元数据。图3定义生态科学数据集、数据集系列和元数据之间的关系。它规定一个数据集应有一个或多个相关的元数据实例。数据集可以聚合为数据集系列,也应为数据集系列提供元数据。元数据由一个或多个元数据子集(UML包)组成,一个元数据子集包含一个或多个元数据实体(UMI.类)。7
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。

标准图片预览:





- 热门标准
- 国家标准(GB)标准计划
- GB/T15361-2009 岸边集装箱起重机
- GB/T2828.1-2012 计数抽样检验程序 第1部分:按接收质量限(AQL)检索的逐批检验抽样计划
- GB/T50010-2010 混凝土结构设计标准(2024年版)
- GB6857-2008 pH 基准试剂 邻苯二甲酸氢钾
- GB/T15329.1-2003 橡胶软管及软管组合件 织物增强液压型 第1部分: 油基流体用
- GB19651.3-2008 杂类灯座 第2-2部分:LED模块用连接器的特殊要求
- GB/T7251.1-2023 低压成套开关设备和控制设备 第1部分:总则
- FZ/T52002-1991 锦纶短纤维
- GB/T3452.1-2005 液压气动用O形橡胶密封圈第1部分:尺寸系列及公差
- GB50736-2012 民用建筑供暖通风与空气调节设计规范
- GB/T1804-2000 一般公差 未注公差的线性和角度尺寸的公差
- GB/T3091-2015 低压流体输送用焊接钢管
- GB50204-2015 混凝土结构工程施工质量验收规范
- GB50116-2013 火灾自动报警系统设计规范
- GB/T5009.91-2003 食品中钾、钠的测定
请牢记:“bzxz.net”即是“标准下载”四个汉字汉语拼音首字母与国际顶级域名“.net”的组合。 ©2009 标准下载网 www.bzxz.net 本站邮件:bzxznet@163.com
网站备案号:湘ICP备2023016450号-1
网站备案号:湘ICP备2023016450号-1