垂直搜索算法研究

垂直搜索算法研究

ID:44041994

大小:364.95 KB

页数:66页

时间:2019-10-18

垂直搜索算法研究_第1页
垂直搜索算法研究_第2页
垂直搜索算法研究_第3页
垂直搜索算法研究_第4页
垂直搜索算法研究_第5页
资源描述:

《垂直搜索算法研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、论文题目:垂直搜索的算法研究作者姓名:乍涛专业名称:计算机软件与理论指导教师:李登道匚入学时间:2008生9卄研究方向:软件工程__职称:教授论文提交日期:2011年5月论文答辩日期:2011年6月授予学位日期:StudyonAlgorithmsoftheVerticalSearchADissertationsubmittedinfulfillmentoftherequirementsofthedegreeofMASTEROFengineeringsciencefromShandongUniver

2、sityofScienceandTechnologyLiTaoSupervisor:ProfessorLiDengdaoCollegeofInformationScienceandEngineeringMay2011本人呈交给山东科技大学的这篇硕士学位论文,除了所列参考文献和世所公认的文献外,全部是木人在导师指导下的研究成果。该论文资料尚没有呈交于其它任何学术机关作鉴定。硕士生签名:日期:AFFIRMATIONIdeclarethatthisdissertation,submittedinfulf

3、illmentoftherequirementsfortheawardofMasterofEngineeringScienceinShandongUniversityofScienceandTechnology,iswhollymyownworkunlessreferencedofacknowledge.Thedocumenthasnotbeensubmittedforqualificationatanyotheracademicinstitute.Signature:Date:摘要随着互联网上的

4、信息量越来越大,传统的通用搜索引擎对信息的查找、索引越发显得力不从心,逐渐显露出“准确性并、时效性并、覆盖率低,,等弊端。通用搜索引擎立意于满足用户的公共信息杳询需求,它根据用户输入的杳询串与索引页面在内容上的匹配程度的高低来筛选、返冋页面。这种检索方式不但带冋大量的无关页面,而且缺乏准确性与实效性,已不能满足人们日益增t的对个性化服务的需求。针对以上情况,另一种搜索引擎悄然出现,它可以在一定范围内取得比传统搜索引擎更令人满意的结果,这就是垂直搜索引擎。垂直搜索引擎的核心部分是垂直搜索算法。本文首

5、先介绍通用搜索算法的基本原理和关键技术,并对这些算法的优缺点进行了分析,并在此基础上提岀了垂直搜索算法。本文对通用的PageRank算法和Hits算法进行了改进:适当的增加主题关键词的权值,对相关的属性赋予适当比重的权值。针对传统的搜索算法产生“主题漂移”和“属性漂移”的问题,本文适当的调整了算法的权重I大I子,使算法尽可能的避免这类问题。本文对算法阀值的选取进行了讨论,并指出了需耍考虑的因索及其对算法结果的影响。作者针对改进的算法设计了一个简单的实验环境,并对改进的算法进行了验证,实验表明,改进

6、的算法能够适当的避免主题漂移等问题。关键词:垂直搜素,搜索算法,权重因子,阀值ABSTRACTWithmoreandmoreinformationappearsontheinternet,thetraditiona1genera1searchenginesforinformationsearchgraduallyrevealedmoreandmoreproblems,likenaccuracylackness,poortimelinessjowcoveragen.TheGeneralsearche

7、nginecansatisfytheuser'spublicinformationquerydemands,anditaccordingtouserinputindexpagequerystringsincontentwiththematchingdegreelevel9andreturntothepage・Thiskindofmethodsnotonlyhasbroughtlackofaccuracyandlowpageeffectiveness,andalreadycannotsatisfyp

8、eoplegrowing^individualizedserviceneeds・Inviewoftheabovesituation,anotherkindofsearchengine,itcanprovidemoresatisfactoriedresultsthantraditiona1searchengineincertainscope.whichiscalledvertica1searchengine・Thecoreofvertica1searchisverticaIsearc

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。