关于制定中文元数据标准的思考

关于制定中文元数据标准的思考

ID:26529732

大小:53.50 KB

页数:7页

时间:2018-11-27

关于制定中文元数据标准的思考  _第1页
关于制定中文元数据标准的思考  _第2页
关于制定中文元数据标准的思考  _第3页
关于制定中文元数据标准的思考  _第4页
关于制定中文元数据标准的思考  _第5页
资源描述:

《关于制定中文元数据标准的思考 》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、关于制定中文元数据标准的思考【内容提要】作者认为,中文元数据标准应以DC为基本框架,并完全遵循和保留DC的结构、特点及扩展方式等,坚决防止MARC化倾向;中文元数据标准应形成一个完整的体系,对所涉及的相关的中文标准、规则、方案等,按照通用性、易用性等原则进行修改和制定;这一标准体系应成为全球各类中文信息资源著录和检索的标准。【摘要题】信息资源建设与管理  元数据是“关于数据的数据”或“关于数据的结构化数据”,现在常说的元数据,是特指在标记语言(SGML、HTML、XML)环境下,对网络信息资源进行描述的解决方案,主要是用于网络信息

2、资源的发现、存储、管理和检索利用。在当前网络信息呈异常迅猛发展之势,大量的多样性的数字化资源,使得信息的利用和查找十分困难。为了解决这一问题,在国外已有了很多的元数据研究项目和成果,建立和运行了一些描述网络信息资源的元数据模式。元数据的应用,为网络信息资源的有序组织、适度控制和高效检索利用,提供了便利的条件。近年来,中文网络信息资源也在迅速增长,尽快研究和制定中文核心元数据标准,已是非常迫切的了。在制定中文元数据标准时,既要考虑到中文元数据处理的特殊性和中文资源的应用特点,更要从全球的信息大环境出发,分析、研究和借鉴国际上先进的、

3、通用的元数据标准,在尽量保持与国际标准接轨的基础上,制定符合中文资源应用需要的扩展与应用规范。    1 中文元数据标准应以DC为基本框架  在国际上众多的元数据方案中,DublinCoreElementSet(都柏林核心元素集,简称DC),以其结构简单、语意互通和可扩展等特性,事实上已成为国际范围内通用的网络信息资源描述的元数据标准。DC经过几次国际会议的研讨和修订,已逐步完善和成熟。所以,制定中文元数据标准应以DC元数据为基本框架。国内在四五年前就已开始了对DC的探讨和研究,但至今尚未完全形成依托中文环境的DC元数据标准。当前

4、应进一步加紧深入地对其进行研究和规范,形成中文元数据的一个标准核心集,以适应中文网络信息资源的发展。中文元数据标准应完全按照DC元数据集来建立,在具体作法上要注意以下一些问题。  (1)完全按照DC元数据的框架结构来制定中文元数据标准。由于网络信息资源在时空上的广泛性和开放性,与传统的文献著录的相对封闭性有着很大的不同,因此,中文元数据标准的制定,应强调与国际接轨,保持完整的一致性。也就是说要完全遵循DC元数据的框架结构来构建中文元数据标准,而不应该提出“以DC为主,参考其它元数据标准”来搞中文元数据标准。我们应汲取MARC的教训

5、,避免把中文元数据标准搞成“DC”。中文元数据标准应该只是对DC元数据进行本地化和中文化的处理,对它的内涵、外延等用中文予以标准地诠释,方便使用中文的著录者和检索者理解与利用,仅对于著录和检索中文信息资源的一些特殊性和应用特点等有限的方面进行规范的规定和定义。  (2)中文元数据标准的制定,应完全保留DC元数据的基本特点。一般地讲,内在性、可扩展性、独立句法结构、可选择性、可重复性和可修饰性是DC的6大特点,在实践中集中地表现为DC元数据的简易性、通用性、兼容性以及灵活的可扩展性,这些特性是DC能够成为一个国际上通行的元数据标准的

6、原因,也是建议中文元数据标准应完全按DC来制定的理由。因此,在制定中文元数据标准时,要完全保留DC的基本特点,不应有任何的更改。在国内有些使用DC元数据时,将某些元素规定为“不可重复”或“必备”等等,这种做法是不可取的。  (3)应以国际通行的DC修饰限定词作为中文元数据的规范和扩展的依据,而不应采用其它形式。DC修饰词提供了对元数据的扩展描述,可以缩小元素的含义范围,使其更具有专指性,或是对元素进行规范性说明。目前,DC已正式确定了三类修饰:模式体系、语言种类和类型。如为了表达不同的日期,在使用“Data(日期)”这一元素时,可

7、以增添“Created(创建)”、“Valid(有效)”、“Issued(发行)”、“Modified(修改)”等修饰词。在中文元数据标准中,不应把这些元素的修饰词解释为子元素。元素与加了修饰词的元素没有主次之分,修饰词并不改变元素本身的定义。元数据标准中,不应出现子元素的提法。元素的修饰限定和规范,是元数据元素的内在特性,是元素的不同表现形式,绝不能把元素和加了修饰词的元素看作是元素与子元素的关系,应坚决防止中文元数据标准的MARC化倾向(在MARC中就有的字段、子字段之分)。元素与加了修饰词的元素或多个附加了修饰词的元素同时出

8、现,是元数据的元素可重复性的体现。    2 中文元数据标准应形成一个完整的体系  中文元数据标准是整个网络上中文信息资源及中文电子出版物等的著录和检索的工具,其应用范围是很广泛的。因此,制定中文元数据标准的同时,还应对所涉及的相关的标准、规则和条

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。