地方研究文献数据库主题检索初探

地方研究文献数据库主题检索初探

ID:22319520

大小:51.00 KB

页数:5页

时间:2018-10-28

上传者:U-991
地方研究文献数据库主题检索初探_第1页
地方研究文献数据库主题检索初探_第2页
地方研究文献数据库主题检索初探_第3页
地方研究文献数据库主题检索初探_第4页
地方研究文献数据库主题检索初探_第5页
资源描述:

《地方研究文献数据库主题检索初探》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

  地方研究文献数据库主题检索初探|第1 一、地方研究文献数据库的数据源地方研究文献数据库是中文文献信息资源数字化的重要组成部分。地方研究文献是指本地与外地出版的某一地域或区域的内容的文献,建立地方研究文献数据库是为了使用户全面了解某一地域或区域的社会生活、经济、文化等信息,便于用户进行地方研究。地方研究文献数据库的数据源主要是:1.资料性文献。例如地方志、文史资料等,史料、年鉴、统计资料、政府出版物(白皮书、蓝皮书等)。在我国,历代纂修的各地区资料性文献很丰富,广西省1988年出版的《广西方志提要》,收录1950年以前出版志250种。广东省1950年以前历代编修的地方志达800多种,80年代以来新修省、市、县地方志已出版1000多种,规划出版专业性地方志5000多种。2.论文、论著包括地方研究丛书、丛编、报刊上发表的论文和会议论文、调研报告、论文集等。例如有关南海及南海诸岛的《南海海区综合调查研究报告》、《南海海洋生物研究论文集》,据不完全统计, 1993-1994年南海海洋科学方面的70多篇论文,发表在20多种期刊上。此类文献很多是全国或省市社会科学研究项目的科研成果,为领导决策提供理论依据,为社会主义建设服务。例如,《广西社会经济情势考察研究报告集》一书是国务院下达的《西南地区国土资源综合考察和发展研究》项目中的广西部分研究成果。广西壮族自治区制订广西十年规划和“八五”计划时,采纳了《广西对东南亚开放战略研究》报告中提出的一些对策和建议。3.政策性文献和法令法规例如,地方性党政会议及文件,领导人讲话、文章等,地方法令法规也可在此范畴内。这是发展地方经济的重要政策法令依据,是重要文献类型,一般全文收入。4.新闻媒介的消息报导随着地方报刊的种数与版面激增,中央和地方新闻媒介大量报导各地的各类消息,例如《广州日报》设立珠江三角洲的专版,《南方日报》设立广州的专版。此类信息内容广泛,时间性强,及时报导要闻以及地方不同阶段的热门话题。二、地方研究文献的主题地方研究文献的主题与文献的类型、文献的内容、数据库收录范围及库容量等均有密切关系。 地方研究文献的类型多样,信息量大,文献的主题包含历代社会的内容,更多的是反映当代社会生活的各方面,与学科(或专业性)文献以及新闻信息相比较,其主题范围更广泛,而且年代更久远。另一特点,不同地区不同时期社会生活中的热点有异,文献内容即论述、报导的问题有较强时效性,有的信息的生命力也有时间限制。例如,香港新机场建设和运营之初,引起社会极大关注,一个月内香港出版的报章杂志报导有关新机场的消息与评论数百条,现在这方面的报导就很少。地方研究文献数据库既有书目数据库(数据形式为书目、索引、文摘),也有全文数据库,而且全文数据库和多媒体技术发展很快,文献信息资源数字化技术的发展,使数据库建库方式,同一数据库中数据的形式等均发生变化。地方研究文献数据库应比较全面地反映该地区社会的发展,包括历代政治、经济、文化教育、科学技术,自然现象、历史事件、地理及名胜古迹、风土人情以及机构、人物等。数据形式包括二次文献、全文以及图像(包括地图等)、音像。用户可按需要查阅、下载或打印数据库中某一主题的全部文献。建库方式的变化,既可从某一文献部门自建库,也可联合建库,甚至跨地区、跨国合作建库。 文献资源数字化建设,文献数据库建库技术的发展,以及用户文献检索的需求的变化,对检索语言、文献主题的处理技术以及MARC格式等提出了更高的要求。海量文献、建库速度与质量的提高,要求录入和主题处理技术有较大的突破。目前汉字录入和扫描技术的进步,录入速度大大加快。但主题标引已成为建库的“瓶颈”,加上主题表编制与管理技术的滞后,直接影响建库的速度和质量,难于满足文献检索的需要。为此,张琪玉、侯汉清、张涵等国内著名专家和同行都在探讨解决的办法,提出了一系列建议,例如大量编制自然语言词表;设计分类表——叙词表转换系统,实现网络环境下情报检索语言兼容互换;利用主题表开发研制自动标引检索系统,实现自动标引等。这些建议都是有益的探索,对于地方研究文献数据库的建库技术的改进和提高有重要参考价值。笔者从事地方研究文献数据库建库工作多年,结合建库实践提出一点不成熟的看法。三、地方研究文献主题处理技术的改进措施文献主题的处理技术可分为两部分:一是主题标引工作;二是词表的编制与管理。1.主题标引工作 目前的文献主题标引工作人为因素太多。首先是标引规则的限制,几乎每个文献数据库都制订主题标引规则,内容包括:选用的信息和标引的内容范围;标引深度(标引多少主题词,主题词的汉字数目限制等);标引词的选择,主题标引方式(自由标引还是选用主题表);对文献主题采用整体标引或分析标引;标引词的著录方式;不同类型或题材、体裁文献的标引规则;人名、地名、时间因素等有关规定……为了保证同一主题标引一致性,规则的制订尽量详细具体。这样一来,标引人员工作时受到很大制约,需熟记标引规则并按此处理文献主题。标引是为了检索,然而如果表达文献内容远远超过标引规则的规定(例如规定15个主题词),不但造成标引的困难,而且主题或标引词选取不当将影响文献的检索利用。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭