[硕士论文] 垂直搜索引擎的设计与实现

[硕士论文] 垂直搜索引擎的设计与实现

ID:4242619

大小:1.93 MB

页数:68页

时间:2017-11-30

[硕士论文] 垂直搜索引擎的设计与实现_第1页
[硕士论文] 垂直搜索引擎的设计与实现_第2页
[硕士论文] 垂直搜索引擎的设计与实现_第3页
[硕士论文] 垂直搜索引擎的设计与实现_第4页
[硕士论文] 垂直搜索引擎的设计与实现_第5页
资源描述:

《[硕士论文] 垂直搜索引擎的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西北工业大学硕士学位论文垂直搜索引擎的设计与实现姓名:吴欣茹申请学位级别:硕士专业:软件工程指导教师:王庆20061201摘要随着Internet的迅速发展,Web己经发展成为包含多种信息资源、站点分布全球的海量信息服务网络。搜索引擎是一种用于帮助Web用户查询信息的搜索工具,它以一定的策略在Internet中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务和信息导航。通用搜索引擎的特点是:索引数据库的规模大;检索结果数据量特大。随着信息多元化的发展,通用搜索引擎己经不能满足主题用户的需求。用户迫切需要一个数据分类细致、精确、全面、更新及时

2、的面向特定主题的搜索技术和方法来获得主题资源信息。在这种需求的推动下,垂直搜索引擎应运而生。论文研究了搜索引擎的相关技术,通过分析基于查询串方式的搜索引擎和分类目录式搜索引擎的整体结构,设计了垂直搜索引擎的系统结构,并对其中涉及的关键技术:Web搜集器、信息抽取技术、中文分词和检索技术进行了深入研究,期望对推进本领域的技术发展作一点贡献。在总体设计方面采用的是模块化思想,垂直搜索引擎被分为搜集子系统、索引子系统和检索子系统,各子系统相对独立,实现较为方便。本文实现的垂直搜索引擎已经在实际中成功运用,具有较好的效果,很好地满足了主题用户的需求,具有广阔的市场前景。

3、关键词:搜索引擎,信息抽取,下推自动机,中文分词,页面距离西北工业大学硕士学位论文AbstractAbstractWiththepfeval锄ccofthenetworkapplications,theInteracthasbcc0蚰ea∞wicenetworkprovidingmassinformation,whichincludesvariousinformationresourcesandsitesdistributedallovertheworld.Thesearchengineisakindofsearchtoolshelpingwebusertolo

4、okupinformation.ItcollectsandseeksinformationintheInteractwithcertainstrategiesandprovidesretrievalserviceandinformationnavigationOnthebasisofextracting、organizinganddealingwiththeinformation.Thecharacteristicsofthegeneralenginemelarge—scaleindexdatabaseandmassretrievalresultdata..Wi

5、ththedevelopmentofdisparateinformation,thegeneralsearchenginecan'tmeetthetopiccustomers.Thecustomersneedaparticularsubject-orientedtechniqueandmethod,whichisaccurate,all—sidedandupdatedtimelytoobtainresourcesaboutsometopic.Bythepromotionofthiskindofdemandstheverticalsearchengineemerg

6、eatthisbackground.Thethesisstudiedtherelatedtechniqueofthesearchengine,designedthesystemarchitectureoftheverticalsearchenginebasedonanalyzingthetraditionalsystemstructureofthesearchengine.Inthisarticle,somekeytechniquesinvolvedinthesearchenginesuchaswebcrawler,informationextraction,C

7、hineseparticipleandtheretrievingtechniquesarestudiedindetail,Bylucubrafingthesekeytechniques,theauthorexpectSomehelptothedevelopmentinthisfield.Modularthoughtwasadoptedinthesystemdesign.Theverticalsearchengineisdividedintothreeparts:thecollectsub-system,theindexsub-systemandtheretrie

8、valsub·syste

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。