化工专业搜索引擎索引技术的研究与实现

化工专业搜索引擎索引技术的研究与实现

ID:32348568

大小:7.60 MB

页数:69页

时间:2019-02-03

化工专业搜索引擎索引技术的研究与实现_第1页
化工专业搜索引擎索引技术的研究与实现_第2页
化工专业搜索引擎索引技术的研究与实现_第3页
化工专业搜索引擎索引技术的研究与实现_第4页
化工专业搜索引擎索引技术的研究与实现_第5页
资源描述:

《化工专业搜索引擎索引技术的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要化工专业搜索引擎索引技术的研究与实现随着互联网技术的迅速发展,网络上的资源日益丰富,各类搜索引擎应运而生,并迅速发展壮大。以百度,Google为代表的综合性搜索引擎搜索范围几乎涵盖了各个领域。但是,这些综合性搜索引擎在检索某一特定领域的信息时,无论是检索效率还是检索精度都无法满足人们的需要。为了进一步挖掘某一专业领域的网络信息,发展出了具有领域特点的专业搜索引擎。化工专业搜索引擎主要用于检索网络上化工领域相关信息。本文在深入了解搜索引擎相关索引技术的基础上,对Lucene开源源代码进行研究与实践,分析了Lucene的系统组织结构、基本数据类型、索引内存结构、索引数据库的

2、文件结构。深刻理解其索引过程以及索引方式,掌握了索引权重的控制、索引优化的方法。在此基础上,对源代码进行了创新性的改进,设计了用多索引器对文档进行索引的机制,有效地缩短了索引时间,改进了索引库词典文件中词条默认的排序方式,有效地减少了检索的响应时间,为待索引化工专业文档设置权值,有效地提高了检索化工信息的精度,创建了有利于化工专业信息检索的索引库。本文实现的索引器可以快速地为化工文档库建立高性能的倒排索引库,不仅适用于化工专业搜索引擎,而且适用于化工专业文献检索系统,对其他专业搜索引擎索引库的建立也有一定的参考作用。北京化.1:人学硕十学位论文关键词:Lucene,索引库,

3、多索引器,排序算法,权值Ⅱ摘要THEl啦SEARCHANDREAI。IZ棚ONOFINDEXTECHNOLOGYINCHEMICALSEARCHENGINEABSTRACTWiththerapiddevelopmentofIntemetandWWW;thcresourceillIntemetbeComemore锄dInore,therefbre,manykindsofsearcllenginebasedonIntemetdevelopquickly.Thegeneralsearchenginessuch弱(沁ogle,BaiduareVe巧excellentattheirs

4、earchfunctions,youcansearchalmostallinfomationineve巧field.ButtheyareunfitableinaCertainprofessionalfield.Itisnecessa巧todeVelopprofessionalsearChengineinspecificallyfieldinordertosearchinginfomatione如ctively.Chemicalsearchengineisonetypeofprofessionalsearchenginef研searcllinginformationiIlch

5、emicalfield.Inthispapef,base0ncomprehendingrelative1【IlowledgeaboutindextechnologyillsearChengiIlede印ly,weanalyzeandresearchthesourcecodeofLuceneinApachefull—textsearchsystem,andmasterthesystemstmcture,thebasicdatatype,theindexstructureiIlmemory,thestmctureofindexfileinLucenesystem.W

6、eunde

7、rstandtheprocessofiIldexingandthemeasureofindexing,andmasterthemeasureofcontrollingindexweightandoptimizingindex.Basedonthem北京化J:人!学硕十学位论文research,theprojectofInulti-indexerisdesignedtodecreasethetimeofestablishingindexe虢ctiVely,theef£icienCyofsearchingchemicaltemsc觚beimproVedbyoptimizings

8、onillgprocessoftemofindexlexiconfile,theindexeddocumentsareaddeddi雠renttypesofparametersvaluestoimproveaccuracyofsearchingchemicalterms,Thisindexdatabaseismoresuitableforsearchingchemicalim’ormation.Thisindexerwhichcaneatablishinvertedindexdatabaseforchemicald

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。