基于lucene的全文检索系统的研究与应用

基于lucene的全文检索系统的研究与应用

ID:33298203

大小:2.39 MB

页数:61页

时间:2019-02-23

基于lucene的全文检索系统的研究与应用_第1页
基于lucene的全文检索系统的研究与应用_第2页
基于lucene的全文检索系统的研究与应用_第3页
基于lucene的全文检索系统的研究与应用_第4页
基于lucene的全文检索系统的研究与应用_第5页
资源描述:

《基于lucene的全文检索系统的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、大连理工大学硕士学位论文摘要全文检索是现代信息检索技术的一个非常重要的分支,它是处理非结构化数据的强大工具,也是搜索引擎的核心技术之一。本文对中文全文检索的有关技术进行了较为深入的研究。在基于字表的全文索引方面,本文提出了一种改进的倒排索引结构,同传统索引结构相比,更便于索引的构建、维护、更新。并根据其特征,设计了优化的查询策略。分析比较的结果表明,改进的索引结构在获得较高的动态性能的同时,还能有效地提高创建索引的速度。本文的重点放在了全文检索技术的应用上,对如何利用新技术、改善检索系统的结构、提高检索系统的性能和效率、加快检索速度、不断适应网络信息发展等方面

2、做了重点研究。全文检索是一种I/o密集型的应用,以往的全文检索系统的开发多在关系数据库的基础上进行。本文针对全文数据库的特点,深入讨论此法弊端与不足,并提出了在文件系统上构建的解决方案。由于目前全文检索系统的开发平台并不多见,本文介绍了一种全文检索引擎工具包一-Lucene,它功能强大,小巧精悍,便于嵌入各种应用.近年在世界各地被广泛使用,诸如IBM等公司都使用其核心代码.作为一个开源软件,它为我们学习搜索引擎的核心技术提供了绝佳的机会,对其剖析研究、进行二次开发,是一件很有意义的事情。在应用方面,本文主要工作是本校学位论文全文数据库的设计与实现。其检索子系统

3、在文档数据加工、信息抽取及分类器相关工作的基础上,完成构建索引器、数据库存储设计、检索器设计等内容,最终实现了系统对中英文文献的导航浏览、全文枪索和元数据检索服务功能.就检索的效率和效果而言,基本达到了最初的设计目的。关键词:全文检索:单汉字标引;倒排文件;Lucene;全文数据库基于Lucene的全文检索系统的研究与应用TheResearchandImplementationofFull-textRetrievalSystembasedonLuceneFull-textretrievalisanimportantinformationretrievaltec

4、hnology.Itisapowerfultoolfordealingwithnonstructuraldata,andisoneofthekeytechnologiesofthesearchengine.Thispaperdeep卜researchonChineseful-textretrievaltechnology.hthefiledofful-textindexbasedonwordinvertedtable,aimprovedword-basedChineseinvertedindexstructureisproposedwhichhasabeter

5、performancethantraditionalapproaches,andconvenientforconstructing,maintainingandupdatingindex.Accordingtoitscharacteristic,wedesignitscorrespondingoptimizedsearchmethod.Analysisshowsthatbeterdynamicperformanceandhighindexingspeedispossibleusingthisstructure.Thispaperpaysmoreatention

6、inapplicationofful-textretrievaltechnologies.Howtousenewtechnique,optimizethestructureofretrievalsystem,improveperformanceandefficiency,咖ckensearchspeedandadaptthedevelopmentofcurrentwebisalsodiscussedinthispaper.Ful-textretrievalisan1/0intensiveapplication..Itspreviousdevelopmentsa

7、recarriedonthebasisofrelationdatabase.Thispaperdeeplydiscussestheabuseanddeficiencyofthismodeaccordingtoitscharacteristic.Becausethedevelopmentplatformoffitl-textretrievalisabsentcurrently,Lucene,aful-textsearchenginetooldtisintroducedintothepaper.Ithaspowerfulperformanceanditsbodyi

8、scabinet,capableand

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。