图书检索系统体系架构研究

图书检索系统体系架构研究

ID:31432997

大小:104.50 KB

页数:5页

时间:2019-01-09

图书检索系统体系架构研究_第1页
图书检索系统体系架构研究_第2页
图书检索系统体系架构研究_第3页
图书检索系统体系架构研究_第4页
图书检索系统体系架构研究_第5页
资源描述:

《图书检索系统体系架构研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、图书检索系统体系架构研究  摘要:图书馆具有非常丰富的馆藏资源,涉及实体图书,电子图书,音像制品等众多知识载体信息,信息的分布呈现出一定的不规则性和随意性,本文从信息检索的角度出发,对众多信息形式进行分析组合,构建信息检索架构,提高资源检索时的效率。  关键词:图书馆资源;信息检索;系统架构  中图分类号:TH166  图书馆,是搜集、整理、收藏图书资料以供人阅览、参考的机构,图书馆中收藏了大量的图书资料。以北京图书馆为例:到2011年底,总、分馆文献资源累积量约1100余万册(件)。其中纸质藏书800余万册,以及近年来大量引进和自建的国内外数字资源,包括各类数据库、电子期刊、电

2、子图书和多媒体资源约300余万册(件)。面对如此浩瀚的信息知识库,用户如何快速定位自己需要的信息是图书馆在信息建设时必须要解决的问题。5  图书馆最早的信息检索方式是采用目录式的方式,即将图书进行分类,不同类别的图书设置不同编码形式(如TP391),用户首先需要明确检索信息的类别信息,再根据类别进行逐次筛选,这种方式在图书馆刚刚兴起时是一种比较好的方式。如今,图书馆中各种信息资源已经呈现出非常明显的增长趋势,基于图书的信息检索系统也因此走上历史舞台,本文结合图书馆中信息资源的特点,以计算机的角度对图书信息检索系统进行剖析,阐述其中的技术细节。  1图书信息检索系统评价指标  信息

3、检索评价是对信息检索系统性能(主要满足用户信息需求的能力)进行评估的活动。通过评估可以评价不同技术的优劣,不同因素对系统的影响,从而促进本领域研究水平的不断提高。信息检索系统的目标是在较少消耗的情况下尽快、全面返回准确的结果。根据F.W.Lancaster的阐述,判定一个检索系统的优劣,主要从质量、费用和时间三方面来衡量。因此,对计算机信息检索的效果评价也应该从这三个方面进行。本文主要研究信息检索系统的质量标准,质量标准主要通过查全率与查准率进行评价。  查全率和查准率是判定检索效果的主要标准,而后两者相对来说要次要些。  查全率是指系统在进行某一检索时,检出的相关文献量与系统文

4、献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。  查全率=[检出相关文献量/文献库内相关文献总量]×100%(1)  查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。  查准率=[检出相关文献量/检出文献总量]×100%(2)  查全率与查准率是评价检索效果的两项重要指标。查全率和查准率与文献的存储与信息检索两个方面是直接相关的,也就是说,与系统的收录范围、索引语言、标引工作和检索工作等有着非常密切的关系。5  影响查全率的因素:从文献存储来看,主要有:文献

5、库收录文献不全;索引词汇缺乏控制和专指性;词表结构不完整;词间关系模糊或不正确;标引不详;标引前后不一致;标引人员遗漏了原文的重要概念或用词不当等。此外,从情报检索来看,主要有:检索策略过于简单;选词和进行逻辑组配不当;检索途径和方法太少;检索人员业务不熟练和缺乏耐心;检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等。  影响查准率的因素:主要有:索引词不能准确描述文献主题和检索要求;组配规则不严密;选词及词间关系不正确;标引过于详尽;组配错误;检索时所用检索词(或检索式)专指度不够,检索面宽于检索要求;检索系统不具备逻辑“非”功能和反馈功能;检索式中允许容纳的词

6、数量有限;截词部位不当,检索式中使用逻辑“或”不当等等。  2信息检索系统体系架构  一个完整的图书信息检索系统应当包括图书信息的预处理,图书信息的入库、用户检索接口、资源匹配、资源排序等部分,本文主要就以下几个部分进行阐述。  2.1索引子系统  索引子系统主要完成的工作是对图书信息的入库工作,图书馆中信息资源具有完整的资源名,然而用户在搜索时是通过输入关键字来发现类似的资源,因此需要对信息资源进行预处理。主要通过对信息资源名构建倒排索引,通过建立关键词和信息资源名之间的邻接矩阵,如此则完成信息资源和关键词之间的关联性,用户可以通过关键词发现自身需要的相关联文档。5  2.2查

7、询子系统  查询子系统主要提供给用户查询接口,用户通过输入检索关键词,查询子系统需要对用户的检索关键词进行分析,可能用户输入的关键词并非规范的形式,可能还存在着错误信息,或者是以字母形式输入,或者是以英文或者其它方式输入,查询子系统需要对输入的检索关键词进行消歧工作。  2.3资源匹配子系统  资源匹配子系统主要根据用户的检索关键词在图书馆数据库资源中进行资源匹配,寻找和用户相关联的资源,资源匹配的方式有很多种,诸如采用完全匹配方式(即用户输入的关键词和数据库中资源完成匹配)、部

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。