基于Java技术的搜索引擎研究与实现

基于Java技术的搜索引擎研究与实现

ID:36760905

大小:2.65 MB

页数:81页

时间:2019-05-14

基于Java技术的搜索引擎研究与实现_第1页
基于Java技术的搜索引擎研究与实现_第2页
基于Java技术的搜索引擎研究与实现_第3页
基于Java技术的搜索引擎研究与实现_第4页
基于Java技术的搜索引擎研究与实现_第5页
资源描述:

《基于Java技术的搜索引擎研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西南交通大学硕士学位论文基于Java技术的搜索引擎研究与实现姓名:何世林申请学位级别:硕士专业:计算机应用指导教师:余立建20060401嚣涛交通犬学硕士娥究生攀位论文撼I页摘要在互联网蓬淤发展鹣今天,互联网上熬售息曼是港如烟海。人们在享受甄连网带来的便利的闷时,却面临满一个如何在如此海艇的内容中猴确、快捷地找到自融所需蒙的信息的问题,由此互联网搜索弓

2、擎馥运两黧。当蓊对于援索雩i蘩静研究是互联礴技术中最热门的领域。本文对攘索萼

3、擎戆琢瑾、缀戒、数据络褥、王作滚稳等方瑟徽了深入而纲致地研究与分析。搜索引辇的未来发展方向是个性化、智能化。瓣于不阏

4、类型的用户瓣搜索相同鲍内容将褥至4不同的雯透合用户的搜索结果,这就是搜索引擎的个性化;而智能化则指搜索引擎具有自我学习的功能,能自动地适应用户的查询需求,并能对用产进行鬻能分类觚雨为搜索弓i擎的个性纯撵供依攒。在理论研究的基础上,本文还利用Java技术对搜索引擎的三个核,§部分帮溺络瓣蛛、掰夏索孳

5、、援索送{亍了实嚣。网终麴蛛部分采用了非递归爬取方式和Java的多线程机制,利用一个基于内存的作数驮列蛰理器受责鼹廷摄取过程中uRL键接的熬入、分嚣、处理等作业,同时使用线程池管理多个抓取线稷,并发抓取网页。索引和搜索部分借助Lucene全文搜索引擎

6、麾中的Java类进行实现。Lucene怒Apache软件纂金会的一个开源项目,完全由java实现,适用于需簧全文搜索能力的应用程序,并具肖良好的跨平台能力。最后采用lsP(JavasefverPages)技术设幸}了一夺蓠易豹羧索雩l蘩客户满。关键词:搜素gl擎;瓣终秘蝾;J鑫v莲;L拄ee矗e;毒SP西南交通大学硕士研究生学位论文第1I页Abs耄r蠢e毫ThecOntents0IltheWebareincreasi珏gexpOnentiallyastherapiddeVelOpment0ftheIntefnet.AprOblemhOwtoOb

7、taintheusefulinformatiOnfromVastc。n£entsqnicklyandaccufateIyisfaeinguswhilepeopleafeenjoy;ngtheconVenie珏ceoflhel珏lefnel。簟hesolVefofthisproblemisWebsearchengine.Nowadays,searchengineisoneofthehOttesttopicsinthefieldofInternettec王lnology.ThefutureInternet{scontent—ofie珏ted.Peo

8、pl搴bfows宝t囊eln£嚣fne£thfo韭g氧。lhesealchresultsofsearchengines.Thispaperdoesanin—depthresearchandanalysisonthetheOry,f£8l珏e、孵of蠡,a稳dd鑫last¥珏el稚feOfaWebseafeh。珏gi珏e.≥匹ea珏w瓤ilelhispaperdiscussesthefuturedevelopingtrendOfseafchengi珏ewhichincludesindiViduationandintelligence.Thesam

9、equerywillretrjeVe硅iffefe珏ta翦dl珏ofesatisfi尊dseafchres娃llsaeeofdingtOt量letypesofusers+TheabOvefunctionofsearchengi珏eiscalledi蘸diVidualiOn。Intelligencemeansthatthesearchenginepossessesth0abiljtyofself—studyinga矗dcanadapttOtheqllefyfeqllirementsOfusefsauto藏1鑫tically。Fuftherl矬of

10、etheinlelllgencec矗拄elassifylhe珏sefsb建sed0nsOmeprimitiVeuserinformatiOn.Classificationisthebasisofindividualion.O热theb鑫sisofres嚣箍fchlhis争鑫pefi瓣pl搴£珏enlslhfeeeorepartsofsearchenginewhichareWebspjder,indexerandsearchef。TheWebspiderutilizesnonwreclIrsiVealgOrithmandmulti-threadi

11、ngtechnologyOfJaVa。AwO}囊l。娃娃l珏嚣娃agefb藏sedO珏systel羟l珏譬f珏ofyisusedtO矗dd,assig

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。