常用搜索引擎的比较

常用搜索引擎的比较

ID:7248259

大小:34.07 KB

页数:9页

时间:2018-02-08

常用搜索引擎的比较_第1页
常用搜索引擎的比较_第2页
常用搜索引擎的比较_第3页
常用搜索引擎的比较_第4页
常用搜索引擎的比较_第5页
资源描述:

《常用搜索引擎的比较》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、常用搜索引擎的比较  (郑州大学信息管理系,河南郑州450001)   摘要:文章主要对Google、百度、雅虎中国三种著名的中文搜索引擎进行了分析比较,突出介绍了信息的搜集方式、检索功能、检索结果、检索效能、搜索服务,探索研究网络环境下搜索引擎效能。   关键词:搜索引擎;百度;Google;雅虎   中图分类号:TP391.3文献标识码:A文章编号:1007—6921(XX)05—0114—02   随着网络信息呈几何级数式增长,用户获取有用的信息变得越来越困难。搜索引擎是我们日常获取

2、网络信息的常用工具,它对迅速筛选所需信息起到很重要的作用。如今世界上的搜索引擎数以万计,因此,选择合适的搜索引擎就成为重中之重。Google、百度和雅虎中国是目前比较有影响力的三种著名的搜索引擎,本文将对其主要的性能指标进行分析比较。 1三种搜索引擎的概况   Google是由斯坦福大学计算机科学系LarryPage和SergeyBrine博士于1998年创建。支持30多种语言检索,包括中文简体和繁体,并有中文Google网页。当输入检索词后,Google每次可以检索30多亿个网页,从众多的网页中

3、选取与检索式匹配的链接,检索效率极高。Google富于创新的搜索技术和典雅的用户截面设计使Google从当今的第一代搜索引擎中脱颖而出。2000年9月,Google开启中文搜索服务,XX年8月在纳斯达克上市,开创了第二代搜索引擎技术。许多权威机构都将其评为最佳搜索引擎。   百度是中国的两位海外留学生李彦宏和徐勇博士创建的中文搜索引擎,它拥有目前世界上最大的中文信息库,总量达到1亿2千万页以上,并且还在以每天几十万页的速度快速增长。2000年1月,百度公司在中国成立了他的全资子公司百度网络技术(XX

4、)有限公司,随后于同年10月成立了深圳分公司,2001年6月又在上海成立了上海办事处。XX年百度在美国纳斯达克上市,成为当年全球资本市场上最为引人注目的上市公司,百度由此进入一个崭新的发展阶段。   雅虎中国是网站分类目录导航的领头军,它以分类目录、网站检索为主,附带网页全文检索,也是目前最重要的搜索服务网站。雅虎有中文、英文等10余种语言版本,每一版的内容互不一样。可以说,每一种不同的版本都是一种不同的、相对独立的搜索引擎。 2Google、百度和雅虎中国的对比 2.1信息搜集方式比较  

5、 搜索引擎对网络信息资源的搜集方式有自动、人工和人工自动相结合三种。另外根据搜索时是否要依据相关主题内容分类,又分为一般搜索和分类主题搜索。   百度是最典型的一种自动搜索引擎,Google是一般典型的自动搜索引擎。它们是由一个称为蜘蛛(Spider)的机器人程序,由四部分组成的自动索引,以某种策略在互联网中搜集和发现信息,然后由索引器把搜集到的信息建立索引,根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该搜索引擎的优点是信息量大、更新及时、不需要人的干预,

6、缺点是搜到信息过多,许多无用信息需要用户从结果中筛选。   雅虎是目录式搜索引擎,它以人工方式或半自动方式搜集信息,由编辑员查看信息,然后人工形成摘要信息,并把信息放在事先准备的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎因加入了人的智力,所以信息准确、导航质量非常高,不足之处是需要人的介入、维护量大、信息量少、信息更新不及时。 2.2检索功能   检索功能的强弱是评价搜索引擎功能的一个很重要的指标。搜索引擎检索功能的评价指标主要包括:基本检索、高级检索、目录式浏

7、览检索和其他功能检索。本文将选取其中最具代表性的指标以图标形式进行比较。   740)this.width=740"border=undefined> 2.3检索结果   检索结果的显示内容与检索界面是否友好也是评价搜索引擎性能的重要指标。检索结果包括相关性排序、显示内容。   2.3.1相关性排序。Google的检索结果按相关性由大到小排序输出,其相关性判断依据的是检索词在网页中的出现词频、位置,另外一个重要的依据是通过与该网页链接的网页与检索词的匹配程度来判断其相关度大小。   百度采用了词

8、频统计、超链分析和竞价排名相结合的方式对网页进行相关性评价,能够比较客观地分析网页所包含的信息,从而在一定程度上保证了检索结果的相关性。   雅虎检索结果的相关性按其相关度计算,一般的检索工具是通过计算检索词在每个结果中出现次数和出现位置来计算相关度的。对用户来说,只要把网页本身优化好,就能在Yahoo中取得很好的排名。   2.3.2显示内容。Google搜索结果显示网页标题、内容简介、链接(URL)及网页条目数,匹配的关键词以粗体

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。