ecip 自动编目软件系统设计思想的探讨

ecip 自动编目软件系统设计思想的探讨

ID:4102383

大小:42.50 KB

页数:4页

时间:2017-11-28

ecip 自动编目软件系统设计思想的探讨_第1页
ecip 自动编目软件系统设计思想的探讨_第2页
ecip 自动编目软件系统设计思想的探讨_第3页
ecip 自动编目软件系统设计思想的探讨_第4页
资源描述:

《ecip 自动编目软件系统设计思想的探讨》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、ECIP自动编目软件系统设计思想的探讨—兼与张丽娟等同志商榷蒋小耘摘要:本文对ECIP计划中自动编目的MARC标准设定问题及自动编目系统实现的设计思想提出了自己的不同见解。参考文献6。关键词:ECIP计划、自动编目、MARC标准、系统设计分类号G254.36ABSTRACTThedifferentviewisraisedinthispaperaboutMARCstandardprobleminautomaticcataloginginECIPprojectanddesignideaoftherealizationofa

2、utomaticcatalogingsystem.6refs.KEYWORDSECIPproject.Automaticcataloging.MARCstandard.Systemdesign.CLASSNUMBERG254.36近年来有关专家提出在我国推行ECIP(ElectronicCataloginginpublication)计划的构想,即利用出版社印前电子文本加注结构标签的方法进行自动编目,其预期目标是由图书的电子文本自动产生新书预报与正式书目数据以后,全社会都可以享用这一成果,发行界和图书馆界都不用另行编目

3、,(见中国图书馆学报04年第4期张丽娟《CNMARC存在的问题与ECIP计划的实施》。)令人振奋。进一步研读了ECIP实施方案的有关著述(见陈源蒸《中文图书ECIP与自动编目手册》),对其中系统实现的设计思想产生了不同看法。本文拟就此问题进行探讨。ECIP自动编目系统的设计思想可简单概括为对图书的印前电子文本用XML语言描述的DC元数据在电子文本上加注结构标签使线性文件转换为数据库文件从而达到一次录入,生成两种产品(图书馆机读目录、图书)的目的。这一转换过程是通过简化CNMARC字段;限制字段指示符的选择性定义以达到M

4、ARC与DC的匹配来实现的。笔者认为,这一设计思想忽略了其产品的使用者对组织知识的需要,所导致的方法论上的错位制约了其目标的实现。图书馆编制机读目录的目的,一是为了多重揭示文献,满足读者获取文献知识的需求,二是数据交换、资源共享。这两方面的主导因素被设计者忽略了。1ECIP的自动编目MARC标准设定中忽略的因素1.1与国际接轨的因素IFLA(国际图书馆协会联合会)的UBC(UniversalBibliographiccontrol,国际书目控制)计划要求“对世界各国发表的主要出版物以一种国际上可接受的方式,全面而迅速地

5、作出基本目录。”这个国际上可接受的方式在我国即物化为采用UNIMARC基础上的CNMARC格式编制可用于书目信息交流的机读目录。既然ECIP产生的是”图书馆都不用编目”的源头书目数据,其采用的MARC格式将CNMARC的479个字段及近千个子字段中,处理中文图书的123个字段简化为47个字段,159个子字段,其书目描述如此不统一是不利于书目数据共享和交换的。其标准与国际标准相去甚远。1.2图书馆业务规范因素我国自90年在UNIMARC的基础上制定了机读目录标准CNMARC,经过图书馆人的10多年努力实现了图书馆服务流程

6、的自动化,但我们不能不看到存在的隐忧,大量的回溯建库过程中,图书的快速进入数据库只要能外借就行;各馆自编MARC在相关字段未作连接等即简单著录形成的不规范机读目录,对于图书馆来说,表面上虽已完成了编目数据但结果带来的负面影响是,由于书目数据建设是一个不可逆过程,作为被描述的对象图书一旦入库如特征描述的不充分就不能被读者检索到,无形中因为存在检出障碍未被读者利用而使得隐性文献不时产生,这样的资源浪费现象是普遍存在的。这就从一个侧面提示我们实体特征描述如果标准过于简单,则会阻碍图书馆目标的实现。1.3读者利用文献的需求因素

7、读者期望图书馆提供的机读目录应该是能够满足其多方面需要的一个完整的检索体系,MARC作为机读目录的著录标准,应当将著录过程中对文献实体描述的各种数据元素尽量考虑周全,应当围绕怎样充分地揭示文献的各种特征,使之充分展现出来为出发点来设置各项字段的定义及功用。机读目录作为一个完整的检索体系,就要考量影响读者查准、查全的各种因素,予以避免,才能满足使用者各种目的的需要。ECIP的MARC对CNMARC的3——、4——、5——字段均有大量的合并。仅以512—517、540这7个字段合并为共用一个517而言,将7种不同的定义混为

8、一种来描述,只能是对检索点的减少及对特征描述准确性的削弱,给读者快速准确的检出形成障碍。例如:由机械工业出版社出版的2003年(第2版)的封面书名为《最新考研英语阅读理解220篇》,书名页、版权记录、书脊等处的书名均是《硕士研究生入学考试英语理解220篇》按照图书著录主要信息源为书名页和版权页的编目规则CNMARC著录:2001#

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。