欢迎来到天天文库
浏览记录
ID:53559241
大小:83.50 KB
页数:8页
时间:2020-04-04
《【精品】搜索引擎发展史.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、搜索引擎发展史Archie一所有搜索引擎的祖先所有搜索引擎的祖先,是1990年由Montreal的McGillUniversity学生AlanEmtage>PeterDeutsch、BillWheelan发明的Archie(ArchieFAQ)0当时WorldWideWeb还未岀现。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。由T"Archie深受欢迎,受其启发,NevadaSystemCo
2、mputingServices大学丁1993年开发了一个GopherCGopherFAQ)搜索工具VeronicaCVeronicaFAQ)。Jughead是后来另一个Gopher搜索丁具。由丁专门用于检索信息的Robot程序象蜘蛛(spider)-样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider(SpiderFAQ)程序。世界上第一个Spider程序,是MITMatthewGray的WorldwideWebWanderer,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)o与Wanderer
3、相对应,1993年10月MartijnKoster创建了ALIWEB(MartijnKosterAnnoucestheAvailabilityofAliweb),它相当J•Archie的HTTP版本。ALIWEB不使用网络搜寻Robot,如果网站主管们希望口己的网页被ALIWEB收录,需要口己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahooo1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其屮最负盛名的三个是:Scotland的JumpStation、Colorado大学OliverMcBryan的TheWorldWideWebWorm(First
4、MentionofMcBryanJsWorldWideWebWorm)、NASA的Repository-BasedSoftwareEngineering(RBSE)spider。1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。这就是Exciteo后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile1994年1月,第一个既可搜索乂可浏览的分类冃录EINetGalaxyCTradewaveGalaxy)上线。除了网站搜索,它还支持Go
5、pher和Telnet搜索。1994年4月,Stanford两名博士生,美籍华人JerryYang(杨致远)和DavidFilo共同创办了Yahoo。随着访问量和收录链接数的增长,YahooH录开始支持简单的数据库搜索。因为Yahoo!的数据是手丁•输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的冃录。搜索效率明显提高。(Yahoo以后陆续使用Altavista^Inktomi>Google提供搜索引擎服务)WebCrawler―互联网上第一个支持搜索文件全部文字的全文搜索引擎1994年初,Washington大学CS学生BrianPinkerton开始
6、了他的小项目WebCrawler(BrianPinkertonAnnouncestheAvailabilityofWebcrawler)□1994年4月200,WebCrawler正式亮相时仅包含来口6000个服务器的内容。WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它Z前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。(后来webcrawler陆续被A0L和Excite收购,现在和excite一样改用元搜索引擎Dogpile)Lycos(CarnegieMellonUniversityCenter
7、forMachineTranslati()nAnnouncesLycos)是搜索引擎史上又一个重要的进步。CarnegieMellonUniversity的MichaelMauldin将JohnLeavitt的spider程序接入到其索引程序中,创建了Lycoso1994年7月20S,数据量为54,000的Lycos正式发布。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘耍,而最大的优势还是它远胜过其它搜索引擎的数据量:1994年8月——394,000documents;1995年1月——1.5millio
8、ndocu
此文档下载收益归作者所有