毕业设计(论文)-基于Solr的搜索引擎研究与实现

毕业设计(论文)-基于Solr的搜索引擎研究与实现

ID:35584252

大小:596.50 KB

页数:56页

时间:2019-03-30

毕业设计(论文)-基于Solr的搜索引擎研究与实现_第1页
毕业设计(论文)-基于Solr的搜索引擎研究与实现_第2页
毕业设计(论文)-基于Solr的搜索引擎研究与实现_第3页
毕业设计(论文)-基于Solr的搜索引擎研究与实现_第4页
毕业设计(论文)-基于Solr的搜索引擎研究与实现_第5页
资源描述:

《毕业设计(论文)-基于Solr的搜索引擎研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要随着信息时代的来临,人们的生活、学习、工作和娱乐已经与信息技术充分的融为一体。随着群众对互联网参与度的增加和企事业单位信息化的逐步深入,信息量也成倍地增长,如何能更好地从浩如烟海的数字信息中快速、精准地查找到需要的信息,成为全国人民的迫切需求。尤其是处于信息化建设道路上的中小企业,如何快速且廉价地开放自己的信息检索系统,对于企业的成长至关重要。本文介绍了搜索引擎的基本原理,对搜索引擎的一些核心技术进行了介绍与深入的分析;介绍了Lucene搜索引擎工具包的架构及其基本使用;对基于开源搜索引擎包Lucene的搜索框架Solr进行架构、代码、配

2、置等方面的研究;最后设计并实现了一个基于Solr1.3的简单可用的多库搜索引擎。整个设计过程致力于提高管理维护的方便性和可扩展性。关键词:Lucene;Solr;搜索引擎;爬虫;中文分词iv-iv-AbstractWiththeadventoftheinformationera,people'slives,study,workandentertainmenthavebeenfullyintegratedwithinformationtechnology.WiththeparticipationofthemassesontheInterneta

3、ndincreaseinthenumberofinformation-basedenterprises,theamountofinformationhasbecomeseveraltimesasbefore.Howtogetusefulinformationquicklyandaccuratelyhasbecomeanimportantthingtoeveryone.Forthesmallandmedium-sizedenterprises,howtodevelopitsownmessageretrievalsystemquicklyandc

4、heaplyisessentialforthegrowthofenterprises.Inthispaper,weintroducethebasicprinciplesofsearchengineandanalysesanumberofcoretechnologies.IalsointroduceLucenesearchenginetools,itsbasicframeworkandhowtouseit.WeanalysesSolr,whichisanopensourcesearchenginebasedonLucene,anditsarch

5、itecture,code,configuration.Atlast,wedesignandimplementasimplemulti-databasesearchenginebasedonSolr1.3.Keywords:Lucene;Solr;SearchEngine;Spider;ChineseWordSegmentationiv-iv-目录第一章前言51.1绪论51.2开源搜索引擎研究的意义和现状7第二章中文搜索引擎关键技术82.1搜索引擎基本结构82.2中文分词102.3相关排序132.4搜索引擎响应速度172.5网络蜘蛛18第三章

6、开源搜索引擎SOLR203.1搜索引擎包Lucene203.1.1Lucene简介203.1.2Lucene与Solr的关系203.1.3Lucene的结构213.1.4Lucene的使用223.1.5Lucene的评分公式263.1.6Lucene的搜索结果排序273.2Solr的介绍283.2.1Solr的特点与优势283.2.2Solr1.3的新特性293.3Solr的配置和使用293.3.1Solr1.3服务器的部署293.3.2Solr1.3体系结构图303.3.3solr.xml配置文件313.3.4schema.xml配置文件3

7、13.3.5solrconfig.xml配置文件333.3.6查询HTTP接口参数363.4Solr1.3的核心机制363.4.1内核调用机制363.4.2分库机制373.4.3缓存机制37第四章基于SOLR的搜索引擎总体设计394.1设计背景和原则39iv-iv-4.2整体结构与模块关系39第五章基于SOLR的搜索引擎详细设计与实现415.1网络蜘蛛模块的设计与实现415.2NewAPI模块的设计与实现425.3管理模块的设计与实现435.4配置文件的配置435.5分词模块的设计与实现445.6查询模块的设计与实现45第六章结论47参考文献

8、48致谢49iv-iv-第一章前言22.11.1绪论随着信息技术的不断发展和人民对信息技术需求的不断增加,世界各国都在经历着前所未有的信息革命。国家的发展离不开信息

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。