基于web搜索引擎的设计与实现本科毕业论文

基于web搜索引擎的设计与实现本科毕业论文

ID:882473

大小:344.02 KB

页数:33页

时间:2017-09-22

基于web搜索引擎的设计与实现本科毕业论文_第1页
基于web搜索引擎的设计与实现本科毕业论文_第2页
基于web搜索引擎的设计与实现本科毕业论文_第3页
基于web搜索引擎的设计与实现本科毕业论文_第4页
基于web搜索引擎的设计与实现本科毕业论文_第5页
资源描述:

《基于web搜索引擎的设计与实现本科毕业论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、本科毕业论文(设计、创作)题目:基于Web搜索引擎的设计与实现DesignandImplementationofWeb-basedsearchengine33摘要网络中的资源非常丰富,但是如何有效的搜索信息却是一件困难的事情。建立搜索引擎就是解决这个问题的最好方法。本文首先详细介绍了基于英特网的搜索引擎的系统结构,然后从网络机器人、索引引擎、Web服务器三个方面进行详细的说明。在次基础上设计并实现了一种快捷高效的新闻搜索引擎,该搜索引擎是从指定的Web页面中按照超连接进行解析、搜索,并把搜索到的每条新闻进行索引后加入数据库,然后通

2、过Web服务器接受客户端请求后从索引数据库中搜索出所匹配的新闻。关键词:搜索引擎;网络机器人;索引引擎;Web服务器33AbstactThenetworkresourcesareveryrich,buthoweffectivesearchinformationisadifficultthing.Buildasearchengineisthebestwaytosolvetheproblem.ThispaperfirstintroducedtheInternetsearchenginebasedonthestructureofthes

3、ystem,andthenfromthenetworkrobots,indexingengine,theWebserverofthethreeaspectsofthedetailedinstructions.Basedonthetimedesignedandrealizedaquickandefficientnewssearchengine,thesearchenginefromtheWebpageinaccordancewithspecifiedintheconnectionforanalytical,search,andthe

4、searchtoeverynewsindexingofaddtothedatabase.ThenthroughtheWebserveracceptclientrequestsfromdatabasesearchindexafterthenewsofthematch.Keywords:searchengine;Networkrobot;Indexingengine;Webserver33目录摘要2目录4第一章绪论61.1搜索引擎出现的背景及意义61.2搜索引擎的发展历史及趋势6第二章搜索引擎的结构92.1系统概述92.2搜索引擎的构

5、成92.2.1网络机器人92.2.2索引与搜索92.2.3Web服务器102.3搜索引擎的主要指标及分析102.4小结10第三章网络机器人113.1什么是网络机器人113.2网络机器人的结构分析113.2.1如何解析HTML113.2.2Spider程序结构123.2.3如何构造Spider程序133.2.4如何提高程序性能153.2.5网络机器人的代码分析163.3小结18第四章基于LUCENE的索引与搜索19334.1什么是Lucene全文检索194.2Lucene的原理分析194.2.1全文检索的实现机制194.2.2Luc

6、ene的索引效率194.2.3中文切分词机制214.3Lucene与Spider的结合224.4小结25第五章基于TOMCAT的WEB服务器265.1什么是基于Tomcat的Web服务器265.2用户接口设计265.2.1客户端设计265.2.2服务端设计275.3在Tomcat上部署项目305.4小结30第六章项目总结以及未来工作展望316.1项目总结316.2未来工作展望31参考文献32致谢3333第一章绪论1.1搜索引擎出现的背景及意义网络的出现以及发展对于世界发展的意义是极其重要的,它让地球村的理念变成现实,信息的传输不再

7、受到时间和空间的限制。在没有搜索引擎的时代,用户希望寻找某方面的信息,就必须通过各种途径或者是网站之间的连接寻找,可以这样说,脱离了搜索引擎的网站,就像是信息海洋中的一个一个孤岛,用户必将面临巨大的搜索成本,同时必须付出大量的时间和精力。搜索引擎的出现改变了上述的现象,它通过程序的自动搜寻并建立索引,将这些信息孤岛联系起来,形成了一张巨大的信息网,并且运用分布式计算的巨大力量,能够让用户从海量数据中摒除垃圾信息,获取想要的知识。搜索引擎不仅仅是节省了用户的时间,通过挖掉搜寻成本这座墙,它让许许多多的不可能成为可能。1.2搜索引擎的

8、发展历史及趋势搜索经历了三代的更新和发展:第一代搜索引擎出现于1994年。这类搜索引擎一般都索引少于1,000,000个网页,极少重新搜集网页并去刷新索引。而且其检索速度非常慢,一般都要等待10秒甚至更长的时间。第二代搜索出现在1996年。这类搜索

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。