欢迎来到天天文库
浏览记录
ID:34096972
大小:153.94 KB
页数:7页
时间:2019-03-03
《搜索引擎发展史》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、本文首发于淘宝皇冠排行榜(http://www.top3721.com/),转载请注明出处搜索引擎发展史1990年以前,没有任何人能搜索互联网。所有搜索引擎的祖先,是1990年由Montreal的McGillUniversity学生AlanEmtage、PeterDeutsch、BillWheelan发明的Archie(ArchieFAQ)。当时WorldWideWeb还未出现。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用
2、户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。由于Archie深受欢迎,受其启发,NevadaSystemComputingServices大学于1993年开发了一个Gopher(GopherFAQ)搜索工具Veronica(VeronicaFAQ)。Jughead是后来另一个Gopher搜索工具。由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider(SpiderFAQ)程序。世界上第一个Spid
3、er程序,是MITMatthewGray的WorldwideWebWanderer,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。与Wanderer相对应,1993年10月MartijnKoster创建了ALIWEB(MartijnKosterAnnoucestheAvailabilityofAliweb),它相当于Archie的HTTP版本。ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介
4、索引信息,类似于后来大家熟知的Yahoo。1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland的JumpStation、Colorado大学OliverMcBryan的TheWorldWideWebWorm(FirstMentionofMcBryan’sWorldWideWebWorm)、NASA的Repository-BasedSoftwareEngineering(RBSE)spider。1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联
5、网上的大量信息作更有效的检索。这就是Excite。后来曾以概念搜索闻本文首发于淘宝皇冠排行榜(http://www.top3721.com/),转载请注明出处名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile1994年1月,第一个既可搜索又可浏览的分类目录EINetGalaxy(TradewaveGalaxy)上线。除了网站搜索,它还支持Gopher和Telnet搜索。1994年4月,Stanford两名博士生,美籍华人JerryYang(杨致远)和Dav
6、idFilo共同创办了Yahoo。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。搜索效率明显提高。(Yahoo以后陆续使用Altavista、Inktomi、Google提供搜索引擎服务)1994年初,Washington大学CS学生BrianPinkerton开始了他的小项目WebCrawler(BrianPinkertonAnnouncestheAvailabilityofWebcrawler
7、)。1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。(后来webcrawler陆续被AOL和Excite收购,现在和excite一样改用元搜索引擎Dogpile)Lycos(CarnegieMellonUniversityCenterforMachineTranslationAnnouncesLycos)是搜索引
8、擎史上又一个重要的进步。CarnegieMellonUniversity的MichaelMauldin将JohnLeavitt的spider程序接入到其索引程序中,创建了Lycos。1994年7月20日,数据量为54,000的Lycos正式发布。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引
此文档下载收益归作者所有