DB13T 2351.3-2016 标准文献结构化数据规范 第3部分:元数据著录规则

DB13T 2351.3-2016 标准文献结构化数据规范 第3部分:元数据著录规则

ID:8250464

大小:1022.26 KB

页数:30页

时间:2018-03-13

DB13T 2351.3-2016 标准文献结构化数据规范 第3部分:元数据著录规则_第1页
DB13T 2351.3-2016 标准文献结构化数据规范 第3部分:元数据著录规则_第2页
DB13T 2351.3-2016 标准文献结构化数据规范 第3部分:元数据著录规则_第3页
DB13T 2351.3-2016 标准文献结构化数据规范 第3部分:元数据著录规则_第4页
DB13T 2351.3-2016 标准文献结构化数据规范 第3部分:元数据著录规则_第5页
资源描述:

《DB13T 2351.3-2016 标准文献结构化数据规范 第3部分:元数据著录规则》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、ICS01.140.20A14DB13河北省地方标准DB13/T2351.3—2016标准文献结构化数据规范第3部分:元数据著录规则StructureddataspecificationsofstandarddocumentsPart3:Descriptiverulesofmetadata2016-05-23发布2016-07-01实施河北省质量技术监督局发布DB13/T2351.3—2016前言本部分按照GB/T1.1-2009给出的规则起草。DB13/TDB13/T2351《标准文献结构化数据规范》包括了

2、3部分:——第1部分:全文元数据;——第2部分:指标元数据;——第3部分:元数据著录规则。本部分是第3部分,本部分与第1、2部分配套使用。本部分由河北省服务业标准化技术委员会提出并归口。本部分起草单位:河北省标准化研究院。本部分主要起草人:卢艳芳、施健、马星晓、谢燕、闫志强、张园园、陈南、李建勋、赵倩、安姣、郭天强、李朴。IDB13/T2351.3—2016引言标准文献电子文档格式有DOCX、数字版PDF、扫描版PDF。在生产、科研和管理过程中,往往需要定位到标准内容、指标信息上,如:检索标准指标、指标比对及

3、标准水平分析等。但是,现有的标准文献电子文档为非结构化文档,这一特性决定它的内容检索指向性笼统模糊,故而,以非结构化文档为单元存储无法实现小颗粒度的指标数据的检索、比对分析。只有通过数据处理将非结构化文档转换为结构化或半结构化文档方能解决上述问题。为寻求上述瓶颈的突破,河北省标准化研究院在2012年将标准文献结构化列为重点科研项目,在此基础上,2013年又承担了国家标准化委员会标准化信息中心的《“双打”重点产品标准文献结构化内容数据库》项目,而实现标准文献结构化必须首要解决2个问题:1)结构化标准的数据结构问

4、题,换而言之,标准结构化加工抽取出的数据是哪些数据?2)抽取出来的数据进行加工应符合什么样的数据规范要求,方能满足与原始标准文本内容的一致性的需求。解决第一个问题,需要建立标准结构化数据模型,并通过元数据规范来实现;解决第二个问题,需要建立数据的著录规则,实现数据的规范性。项目组在确定文献结构化抽取技术的基础上,对4000余项强制性国家标准的内容要素逐一进行了分析研究、归纳总结后,按UML思想确定了标准结构化数据模型,并在工程上对4000余项强制性国家标准进行了结构化数据的抽取验证,确定了结构化元数据。通过验

5、证测试,逐步完善了加工抽取结构化数据的规范要求,形成了《标准文献结构化数据规范》。目前,在行业内广泛使用的GB/T22373-2008《标准文献元数据》是针对标准文献题录的元数据标准,侧重的是标准文献形式特征,而此次制定的《标准文献结构化数据规范》是关于标准内容结构化的全文元数据和指标元数据规范,希望此两个标准的结合使用,实现标准文献信息资源的统一描述,促进标准文献信息资源的开发利用。IIDB13/T2351.3—2016标准文献结构化数据规范第3部分:元数据著录规则1范围本部分规定了标准文献结构化全文(全文

6、、术语、图像、表格、公式)、指标元数据加工的术语和定义、著录项目、著录总则和著录细则等内容。本部分适用于标准文献结构化数据的处理。2规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T1.1标准化工作导则第1部分:标准的结构和编写GB/T7408数据元和交换格式信息交换日期和时间表示法(GB/T7408-2005,ISO8601:2000,IDT)GB18030信息技术中文编码字符集G

7、B/T22373-2008标准文献元数据DB13/T2351.1-2016标准文献结构化数据规范第1部分:全文元数据DB13/T2351.2-2016标准文献结构化数据规范第2部分:指标元数据汉语分类主题词表中国科学技术信息研究所与北京图书馆主编(1980年)3术语和定义下列术语和定义适用于本文件。3.1著录description对文献的内容和形式特征进行分析、选择和记录的过程。[GB/T22373-2008,定义第3.10]3.2著录项目elements用以揭示标准文献形式特征和内容特征的记录事项。3.3核

8、心元数据coremetadata描述信息资源基本属性的元数据元素和元数据实体。[GB/T26816-2011,定义3.5]4著录项目和核心元数据1DB13/T2351.3—20164.1全文元数据著录项目和核心元数据全文元数据著录项目和核心元数据见表1。表1全文元数据著录项目、定义和核心元数据序号著录项目定义核心元数据0标识符名称空间中对象的唯一标识符。*由有关标准化机构给定的用于唯一识别某一标准的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。