《计算机检索原理》PPT课件

《计算机检索原理》PPT课件

ID:36921848

大小:3.94 MB

页数:63页

时间:2019-05-11

《计算机检索原理》PPT课件_第1页
《计算机检索原理》PPT课件_第2页
《计算机检索原理》PPT课件_第3页
《计算机检索原理》PPT课件_第4页
《计算机检索原理》PPT课件_第5页
资源描述:

《《计算机检索原理》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第三章计算机检索原理主要内容1.计算机检索的发展历史2.计算机检索的原理3.文献数据库简介4.计算机检索技术与实现5.计算机检索策略的制定及调整1计算机检索的发展历史计算机检索从产生到现在经历了4个阶段:(1)20世纪50年代,以批量处理、脱机检索为特点的第一阶段。1955年,美国海军武器实验站图书馆在一台电子管计算机上建立了世界上第一个计算机检索系统-NOTS,4000条记录,“与”,不能人机对话;1950年代末,IBM公司利用一台IBM650计算机成功地编制出关键词索引,并建立了世界上第一个定题情报检索(SDI,SelectiveDisseminationofinfor

2、mation)系统,为用户定期检索和提供一定主题的新到文献,并很快得到了推广应用。(2)20世纪60年代末,联机检索阶段,出现人机对话;1960—80年代,数据通讯网络出现,大容量计算机分时系统和强功能检索软件研制成功,使脱机检索发展到联机检索并迅速得到了推广。1970-80年代,联机检索得到迅速发展,一些联机检索系统开始向公众提供商业性服务,如DIALOG、ESA、ORBIT、BRS等许多世界着名的联机检索系统相继投入商业性运营。(3)20世纪70-80年代,联机检索与光盘检索共同发展阶段;前三阶段以文献数据库检索为主(4)20世纪90年代,基于互连网的数据库检索和Int

3、ernet网上信息检索并重的第四阶段-网络系统阶段。Internet成为重要的电子信息源.随着互联网的迅速发展及超文本技术的出现,基于客户/服务器的检索软件的开发,使客户/服务器网络检索模式开始取代以往的终端/主机结构,成为联机检索的发展趋势。计算机网络检索的发展趋势目前,信息检索技术正向两个方向发展:传统信息检索向全文文本、多媒体、多载体、跨平台等新型信息检索的发展,在深度上提高管理和组织信息的能力,如探索自动抽词、自动索引、自动检索、自动文摘、自动分类、Web检索智能代理、数据挖掘、自动翻译等;信息资源的网络化存储和分布式存储,在广度上提高管理和组织信息的能力。2计算机

4、检索的原理计算机检索的原理就是利用计算机将用户所提出的检索标识与检索系统中的标引标识进行比较,将匹配的文献视为命中。所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。计算机信息检索广义上讲包括信息的存储和检索两个方面。计算机信息存储过程是:用手工或者自动方式将大量的原始信息进行加工,具体做法是将收集到的原始文献进行主题概念分析,根据一定的检索语言抽取出主题词、分类号以及文献的其他特征进行标识或者写出文献的内容摘要。然后再把这些经过“前处理”的数据按一定格式输入计算机存储起

5、来,计算机在程序指令的控制下对数据进行处理,形成机读数据库,存储在存储介质(如磁带、磁盘或光盘)上,完成信息的加工存储过程。计算机信息检索过程是:用户对检索课题加以分析,明确检索范围,弄清主题概念,然后用系统检索语言来表示主题概念,形成检索标识及检索策略,输入到计算机进行检索。计算机按照用户的要求将检索策略转换成一系列提问,在专用程序的控制下进行高速逻辑运算,选出符合要求的信息输出。计算机检索的过程实际上是一个比较、匹配的过程,检索提问只要与数据库中的信息的特征标识及其逻辑组配关系相一致,则属“命中”,即找到了符合要求的信息。计算机信息检索原理示意图检索标识(检索式)是检索

6、者根据对课题的分析,制定出的既能反映课题的要求,又符合计算机检索要求的检索语言,其中包括适当的检索词,以及合适的逻辑算符和位置算符。计算机检索系统的构成软件系统中有关的程序和各种文件资料的总称,包括系统软件(如操作系统,输入输出控制程序)和应用软件。硬件系统中采用的各种硬件设备的总称,包括具有一定性能的计算机主机、外围设备以及怀数据处理或数据传输有关的其他设备。主机,是计算机检索系统的中枢。外围设备包括外部存储器,输入输出设备如键盘、光笔、鼠标、光学字符识别装置,显示终端、打印机等。数据库信息存储与数据库结构信息源收集计算机信息检索系统向用户提供检索的各种信息记录均来自各种

7、信息源。各检索系统根据本系统的服务目的选择不同的信息源,并以此为基础建立数据库。在信息源收集阶段主要进行以下的确定工作:1)确定入选信息的专业范围。信息的专业性体现了数据库的特色与权威性。2)确定信息的文献类型。如期刊、会议录、学位论文、标准等。3)确定信息的载体。如印刷品、缩微制品、光盘、磁带、磁盘、网络下载的信息。4)确定信息的加工深度。对于文献数据库而言,加工深度表现为三个层次:题录、文摘、全文。5)确定信息的起始时间。收集的信息时间跨越范围需要根据信息的特点合理选择,回溯年限长,信息时效性就差,但历史性就越

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。