毕业论文 基于lucene的桌面搜索引擎

毕业论文 基于lucene的桌面搜索引擎

ID:4096730

大小:970.05 KB

页数:46页

时间:2017-11-28

毕业论文 基于lucene的桌面搜索引擎_第1页
毕业论文 基于lucene的桌面搜索引擎_第2页
毕业论文 基于lucene的桌面搜索引擎_第3页
毕业论文 基于lucene的桌面搜索引擎_第4页
毕业论文 基于lucene的桌面搜索引擎_第5页
资源描述:

《毕业论文 基于lucene的桌面搜索引擎》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、毕业论文题目:基于Lucene的桌面搜索引擎学院:管理科学与工程学院专业:信息管理与信息系统摘要随着信息资源的高速膨胀和计算机硬件的高速发展,个人PC存储容量变的越来越大。要想在越来越大硬盘里,从海量的资料中查找自己感兴趣的文档信息也随之变得越来越困难。而往往操作系统中自带的搜索器又不能完全满足我们的需求,因此我们迫切需要一款全新的桌面搜索引擎来帮助我们。本文首先简单介绍了基于因特网的搜索引擎的系统结构和原理,然后着重介绍了桌面搜索引擎和全文检索的相关知识,对基于Lucene的全文检索引擎的架构原理方

2、面进行详细的说明,同时对Lucene的索引机制、系统结构,以及中文分词都进行了仔细分析。然后介绍了本文实现的一个基于Lucene的桌面搜索引擎。本桌面搜索引擎一个轻量级的全文检索软件,能够帮助用户方便地在越来越大硬盘里,从海量的资料中查找自己感兴趣的文档。从指定的文件路径中按照目录层次进行解析、搜索,并把搜索到的每条信息进行索引后加入索引文件,然后通过Web服务器接受客户端请求后从索引文件中搜索出所匹配的信息。关键词:桌面搜索引擎、倒排索引、lucene、B/S、文本文件AbstractThisart

3、iclefistintroducesthesystemstructureandprincipleofsearchenginebasedontheinternetindetail,thengivesaminuteexplanationformBasedonthefull-textsearchengineLuceneframeworkandprinciple.Inordertounderstandthetechnologymoredeeply,Ihaveprogrammedanewssearchengin

4、ebymyself.Thenewssearchengineisexplainedandsearchedaccordingtodocument-leveldirectory,thenindexseverysearchedinformationandaddsittotheindexfile.Thenafterreceivingthecustomers'requestsfromthewebserver,itsoonsearchstherightinformationformtheindexengine.In

5、thechapterofintroducingsearchengine,itisnotonlyelaboratethecoretechnology,butalsocombinewiththemoderncode,picturesincluded,easytounderstand.KeyWords:searchengine、lucene、B/S、file目录绪论31.桌面搜索引擎与全文检索51.1搜索引擎的概念及发展51.2桌面搜索引擎简介61.2.1Windows自带搜索功能的不足61.2.2我们需要

6、一款桌面搜索引擎71.2.3桌面搜索引擎现状71.3全文检索81.3.1什么是全文检索与全文检索系统81.3.2全文检索原理91.3.3全文检索的倒排索引原理122.开放源代码的全文检索引擎架构Lucene132.1Lucene简介132.1.1什么是Lucene132.1.2Lucene的应用、特点及优势142.2Lucene系统结构分析152.3深入Lucene索引机制172.4Lucene文档分析与中文分词192.4.1Lucene分析器原理192.4.2中文分词212.5Lucene的索引效率

7、252.6从Lucene学到更多263.基于Lucene的桌面搜索引擎273.1功能简介273.2桌面搜索引擎—索引器设计283.2.1索引器简介283.2.2界面设计293.2.2功能设计303.3桌面搜索引擎—索引器实现313.3.1解析器实现313.3.2中文分词考虑343.3.3索引器实现353.4搜索器实现383.4.1搜索器简介383.4.2搜索器界面383.4.3搜索器实现383.4.4实例演示393.5数据持久化403.5.1持久化简介403.5.2具体实现406.参考资料41绪论我们

8、处在一个信息资源高速膨胀的时代,信息爆炸已成为一个全球性的现象。然而,面对极度膨胀的信息量,面对“混沌信息空间”和“数据过剩”的巨大压力,人们对于信息的苦苦追求和期待忽然间变得踟蹰了。每天在我们所生活在的这个世界都会出现大量的信息,如果能够对这些信息做出一些筛选,既可以为我们的广大用户提供一些好的知识与信息,也为他们为了寻找这些知识与信息节省时间与成本.据统计,新产生的信息中有92%记录在硬盘等磁存储介质上,其次分别是胶片、纸张和光存储介质。也正因为如此

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。