科技情报服务系统的全文检索引擎研究

科技情报服务系统的全文检索引擎研究

ID:33748347

大小:4.19 MB

页数:64页

时间:2019-02-28

科技情报服务系统的全文检索引擎研究_第1页
科技情报服务系统的全文检索引擎研究_第2页
科技情报服务系统的全文检索引擎研究_第3页
科技情报服务系统的全文检索引擎研究_第4页
科技情报服务系统的全文检索引擎研究_第5页
资源描述:

《科技情报服务系统的全文检索引擎研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、豪劫大·警硕士学位论文科技情报服务系统的全文检索引擎研究导师姓名:趱RESEARCHONFULLTEXTRETRIEVALENGINEOFSCIENCEANDTECHNOLOGYD师ORMATIONSERVICESYSTEMAThesisSubmittedtoSoutheastUniversityForProfessionalDegreeofMasterofEngineeringBYXueXiaodongSupervisedbyProf.JiangHaoSchoolofComputerScienceandEngineeringSoutheastUniversityMarch2014东南大学

2、学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。研究生签名:需冢骐日期:—≥萨扫缈东南大学学位论文使用授权声明东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许

3、论文被查阅和借阅,可以公布(包括以电子信息形式刊登)论文的全部内容或中、英文摘要等部分内容。论文的公布(包括以电子信息形式刊登)授权东南大学研究生院办理。研魁签名舢师龇敬吼则、10摘要随着国家实施科技创新战略,实行创新驱动发展等政策措施,企业、研究机构的科研活动日趋活跃,对科技文献的需求也越来越多。如何服务好这样的需求是本项目的最基本的要求,本文主要研究了全文检索引擎,来支持并满足项目需求。项目系统面向企业技术人员提供快速的科技文献查询、和原文获取功能,文献记录在10千万条以上。本文首先研究了项目中与全文检索引擎相关的统一检索模块、和全文检索理论,包括全文检索与全文索引,中文分词、常见的全

4、文索引系统。从理论的基础上,研究了开源全文检索功能开发包Lucene,包括其系统结构、数据流程、分词扩展处理、检索结果排序等。然后在项目的总体的需求、设计、开发的基础上,详细讨论了全文检索引擎的需求、设计、实现。本文基于Lucene框架构建全文检索引擎,Lucene不是一个完备的软件系统,它是一个程序开发工具包,一个系统框架。本文研究了Lucene的系统结构、数据流、索引及查询的逻辑、Lucene分析器理论、IKAnalyzer中文分析器。通过改造Lucene的中文分词功能、排序逻辑、与业务模块交互功能实现了一个完整完备的全文检索系统。经过测试其检索速度小于ls,硬件要求相对较低,良好的满

5、足了科技文献资源统一检索服务的需求。关键词:资源整合、统一检索、全文检索、文献检索、IKAnalyzer、中文分词、Lucene丕亩盔堂亟±堂焦j金塞AbstractAlongwiththenationalimplementationscientificinnoval[ionstrategy,implementsinnovationdrivendevelopmentandotherspecialoperationalpolicymeasures,theresearchprogramofenterpriseanddevelopmentfacilityisincreasinglyactive,

6、alealsogettingmoreandmoretechnicalliterature.HowtoservesuchdemandiSthemostbasicrequestofthisproject.thisarticlehasmainlystudiedthefulltextsearchengine,supportsandmettheprojectneed.nleprojectsystemprovidesthefasttechnicalliteratureinquirytotheenterprisetechnicalpersonnel,andoriginaltextgainfunction

7、.theliteraturerecordover100million.11lisarticlehasfirststudiedunificationretrievalmodule.andfulltextsearchtheory,including伽1teXtsearchandfulltextindex.Chineseparticipleandcommon僦ltextindexsystem.Fromthetheoryfoun

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。