反搜索引擎作弊中种子集合自动扩展算法研究

反搜索引擎作弊中种子集合自动扩展算法研究

ID:37412935

大小:4.41 MB

页数:56页

时间:2019-05-23

反搜索引擎作弊中种子集合自动扩展算法研究_第1页
反搜索引擎作弊中种子集合自动扩展算法研究_第2页
反搜索引擎作弊中种子集合自动扩展算法研究_第3页
反搜索引擎作弊中种子集合自动扩展算法研究_第4页
反搜索引擎作弊中种子集合自动扩展算法研究_第5页
资源描述:

《反搜索引擎作弊中种子集合自动扩展算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、大连理工大学硕士学位论文反搜索引擎作弊中种子集合自动扩展算法研究姓名:韩博申请学位级别:硕士专业:计算机应用技术指导教师:张宪超20091216大连理工大学硕士学位论文摘要随着搜索引擎和万维网的飞速发展,快速增长的网络信息在供人们分享和获取的同时,也催生了大量的搜索引擎作弊行为。搜索引擎作弊是指利用各种手段欺骗搜索引擎排序算法,从而让一些页面获得比它们应得的页面排名更靠前的排名。搜索引擎作弊会造成增加搜索服务提供商的运营成本,降低用户使用搜索引擎的满意程度等问题。传统的基于启发式规则的反作弊算法难以广泛的对抗搜索引擎作弊行为,而且容易被作弊者攻破。基于信

2、任传播的反作弊算法对作弊者的攻击具有较高的鲁棒性,能广泛的抵抗作弊行为。但由于这类反作弊算法有效性依赖于可信的种子节点,因此种子节点集合的数量和质量会约束算法在抵抗作弊行为上的效率。传统的获取种子集合的方法依赖于人工评测。这不仅从成本上限制了种子集合不会太大,而且难以保证选取的种子节点的质量。因此,如何选取或扩展种子节点集合来满足基于信任传播反作弊算法的需要,成为了反搜索引擎作弊算法中值得研究的问题。本文提出的ASE算法(AutomaticSeedExpansion),引入了节点间的可信支持度的概念,并结合领域知识和网络节点共引用的拓扑结构,能够将二个小

3、规模的种子节点集合扩展成为一个大规模的,高质量的,具有较小领域偏向性的种子节点集合,从而满足了基于信任传播的反作弊算法的对种子节点集合质量和数量的需要。同时,本文还进一步分析了如何为ASE算法选取初始的小规模种子节点集合,分别给出了适用于不同情况的两个启发式算法combineSelection和thresholdSeleetion,并分析了它们的算法效率和优缺点。在WEBSPAM.2007数据集上的实验证明了应用ASE的TrustRank排序算法与原始TrustRank算法相比在可信节点提升和作弊节点降级的效率上分别提高了27.2%和49.5%,显示了A

4、SE在提高反作弊算法在抵抗作弊行为上的有效性。关键词:链接分析;PageRank;TrustRank;搜索引擎作弊反搜索引擎作弊中种子集合自动扩展算法研究ResearchonAutomaticSeedSetExpansionAlgorithminAntiSearchEngineStngme)锄Abstract‘W池therapiddevelopmentofsearchengineandWorldWideWeb.theburgeoninginformationonthewebcallbesharedandobtainedbythepeople;meanwh

5、ileitalsoleadstoabundantsearchenginespam.Searchenginespamreferstoutilizingvariousmethodstoletcertainpagesrankinghigherthantheydeserve.Searchenginesparncarlcausemanyproblems,e.g.,increasingtheoperationalcostofsearchserviceprovider,decreasingtheusers’satisfactiononthesearchresults.

6、Conventionalheuristicrulebasedanti-spammingalgorithmscannotdemotethespareuniversally,andtheyareeasilytobeminedbythespammers.Tmstpropagationbasedanti-spammingalgorithmsarerobusttospammers’attackandtheyCandemotethespamuniversally.However,theefficiencyofthesealgorithmshighlyrelieson

7、theseednodes,thequantityandqualityoftheseedsetwillrestricttheefficiencyofalgorithmsinanti—spamming.Traditionally,theseedsetisconstructedviaamanuallyevaluation,nevertheless,thiskindofapproachnotonlyrestrictstheseedsett0besmallinsize,butalsocannotguaranteethequalityoftheselectedsee

8、dset.Thus,howtoselectorexpandtheseedsett

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。