计算机学科新技术论文学科新技术之信息化检索与搜索引擎初探

计算机学科新技术论文学科新技术之信息化检索与搜索引擎初探

ID:9178666

大小:339.91 KB

页数:9页

时间:2018-04-20

计算机学科新技术论文学科新技术之信息化检索与搜索引擎初探_第1页
计算机学科新技术论文学科新技术之信息化检索与搜索引擎初探_第2页
计算机学科新技术论文学科新技术之信息化检索与搜索引擎初探_第3页
计算机学科新技术论文学科新技术之信息化检索与搜索引擎初探_第4页
计算机学科新技术论文学科新技术之信息化检索与搜索引擎初探_第5页
资源描述:

《计算机学科新技术论文学科新技术之信息化检索与搜索引擎初探》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学科新技术之信息化检索与搜索引擎初探学科新技术期末论文姓名:学号:班级:学院:9学科新技术之信息化检索与搜索引擎初探学科新技术-------之信息化检索及搜索引擎初探引言:在学科新技术里我们了解了搜索引擎技术。与常用的泛信息搜索引擎(百度、google)不同,信息化搜索引擎是针对IT从业者、研究机构人员或相关人员对信息化建设相关的技术、解决方案、案例等信息的专业检索工具,国内比较常用的是苦力搜索。一、发展背景1.1数据爆炸中的信息冗杂从20世纪末开始,经济文化领域就迅速进入了信息时代,知识和信息的爆炸式发展与网络的应用成为信息扩张的先锋。面对着网络中浩如星海的庞大知识信息库,

2、无法准确全面的找到所需要的信息成为制约网络信息发展的枷锁。信息检索的索引技术发展弥补了这一缺陷,搜索引擎应运而生,成为海量网络信息准确全面定位的应用技术。搜索引擎是网络信息精准定位的应用,实现了庞大网络信息量的查询。而索引技术是搜索引擎的核心技术。1.2什么是搜索引擎技术随着互联网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找自己所需的信息,就象大海捞针一样,搜索引擎技术恰好解决了这一难题。搜索引擎是指互联网上专门提供检索服务的一类网站,这些站点的服务器通过网络搜索软件或网络登录等方式,将Intemet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据

3、库,从而对用户提出的各种检索作出响应,提供用户所需的信息或相关指针。用户的检索途径主要包括自由词全文检索、关键词检索、分类检索及其他特殊信息的检索。1.3从商业方面讲如今因特网上的信息呈几何级数增长,快速有效地查询信息是一项艰巨的任务,这个需求直接导致了广域网信息检索技术的快速发展,各类搜索引擎层出不9学科新技术之信息化检索与搜索引擎初探穷。但是如同因特网上的信息一样,搜索引擎的发展本身也是无序的,如何选择最符合需要的搜索引擎,通过其在因特网上找到我们所需要的信息,也是一个需要研究和解决的课题。基于这个目的,本文对目前因特网上较有规模的中文搜索引擎的优劣势做了一个粗浅的比较,

4、以期抛砖引玉,使现有的中文搜索引擎发展得更快更好,为您的投资带来一定的辅助作用1.4搜索引擎的发展趋势。一个好的搜索引擎,不仅数据库容量要大,更新频率、检索速度要快,支持对多语言的搜索,而且随着数据库容量的不断膨胀,还要能从庞大的资料库中精确地找到正确的资料。⒈提高搜索引擎对用户检索提问的理解。为了提高搜索引擎对用户检索提问的理解,就必须有一个好的检索提问语言。为了克服关键词检索和目录查询的缺点,现在已经出现了自然语言智能答询。用户可以输入简单的疑问句,比如“如何能杀死计算机中的病毒”,搜索引擎在对提问进行结构和内容的分析之后,或直接给出提问的答案,或引导用户从几个可选择的问

5、题中进行再选择。自然语言的优势在于,一是使网络交流更加人性化,二是使查询变得更加方便、直接、有效。就以上面的例子来讲,如果用关键词查询,多半人会用“病毒”这个词来检索,结果中必然会包括各类病毒的介绍,病毒是怎样产生的等等许多无用信息,而用“如何能杀死计算机中的病毒”检索,搜索引擎会将怎样杀死病毒的信息提供给用户,提高了检索效率。⒉垂直主题搜索引擎有着极大的发展空间。网上的信息浩如烟海,网络资源以惊人的速度增长,一个搜索引擎很难收集全所有主题的网络信息,即使信息主题收集得比较全面,由于主题范围太宽,很难将各主题都做得精确而又专业,使得检索结果垃圾太多。这样以来,垂直主题的搜索引

6、擎以其高度的目标化和专业化在各类搜索引擎中占据了一席之地。目前,一些主要的搜索引擎,都提供了新闻、Mp3、图片、Flash等的搜索,加强了检索的针对性。⒊元搜索引擎,能够提供全面且较为准确的查询结果。现在的许多搜索引擎,其收集信息的范围、索引方法、排名规则等都各不相同,每个搜索引擎平均只能涉及到整个Web资源的30-50%,这样导致同一个搜9学科新技术之信息化检索与搜索引擎初探索请求在不同搜索引擎中获得的查询结果的重复率不足34%,而每一个搜索引擎的查准率不到45%。元搜索引擎(METASearchEngine)是将用户提交的检索请求发送到多个独立的搜索引擎上去搜索,并将检索

7、结果集中统一处理,以统一的格式提供给用户,因此有搜索引擎之上的搜索引擎之称。它的主要精力放在提高搜索速度、智能化处理搜索结果、个性化搜索功能的设置和用户检索界面的友好性上,查全率和查准率都比较高。二、搜索引擎的类型2.1搜索引擎的分类获得网站网页资料,能够建立数据库并提供查询的系统,我们都可以把它叫做搜索引擎。按照工作原理的不同,可以把它们分为两个基本类别:全文搜索引擎(FullTextSearchEngine)和分类目录Directory)。全文搜索引擎的数据库是依靠一个叫“网络机器人(Spider)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。