连续隐马尔科夫模型在点击欺诈识别中的应用研究

连续隐马尔科夫模型在点击欺诈识别中的应用研究

ID:34742670

大小:3.14 MB

页数:67页

时间:2019-03-10

连续隐马尔科夫模型在点击欺诈识别中的应用研究_第1页
连续隐马尔科夫模型在点击欺诈识别中的应用研究_第2页
连续隐马尔科夫模型在点击欺诈识别中的应用研究_第3页
连续隐马尔科夫模型在点击欺诈识别中的应用研究_第4页
连续隐马尔科夫模型在点击欺诈识别中的应用研究_第5页
资源描述:

《连续隐马尔科夫模型在点击欺诈识别中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、上海交通大学硕士学位论文连续隐马尔科夫模型在点击欺诈识别中的应用研究硕士研究生:贺文军学号:1101299088导师:侯立文申请学位:管理学硕士学科:管理科学与工程所在单位:安泰经济与管理学院答辩日期:2013年01月授予学位单位:上海交通大学DissertationSubmittedtoShanghaiJiaoTongUniversityfortheDegreeofMasterTHEAPPLICATIONOFCONTINUOUSHIDDENMARKOVMODELINCLICKFRAUDIDENTIFICATI

2、ONCandidate:HeWenjunStudentID:1101299088Supervisor:HouLiwenAcademicDegreeAppliedfor:MasterofManagementSpeciality:ManagementScience&EngineeringAntaiCollegeofEconomicsAffiliation:&ManagementDateofDefence:Jan,2013Degree-Conferring-Institution:ShanghaiJiaoTongUn

3、iversity上海交通大学硕士学位论文连续隐马尔科夫模型在点击欺诈识别中的应用研究摘要随着搜索引擎关键词广告营销模式的蓬勃发展,欺诈点击行为已经成为困扰广告商和搜索引擎公司的一大难题。对于点击欺诈识别与防治问题的研究也成为国内外学者们关注的焦点。本文分析了搜索引擎在线关键词广告的点击欺诈(clickfraud)问题及其行为特征。鉴于关键词广告对应的点击行为模式较为符合隐马尔科夫模型(HMM)的基本前提假设,本文试图把HMM模型的理论框架应用于点击欺诈识别。本文的工作主要有:(1)HMM只是一个理论框架模型。本

4、文对关键词点击的行为模式进行了分析,搭建了针对搜索引擎关键词广告的连续隐马氏模型(CHMM),并创立了欺诈点击行为的识别方法;(2)根据观测数据,训练得到CHMM模型(参数估计),并对该模型的识别效果进行了验证。统计结果表明:CHMM模型对点击欺诈的识别有较高的准确率;(3)讨论了模型中的参数:隐状态数N、序列的长度R、以及阈值大小,选取不同值的情况下,模型的识别准确度。以确定最佳的隐状态数(固定值)和阈值等参数。(4)由于时间段、突发事件等因素影响,可能导致某一在线关键词广告的点击率明显提升,但是这并不是欺诈

5、点击造成的。本文采用动态的CHMM模型,不断更新用于训练的时间序列数据,以产生新的参数,可以很好的降低这类因素对模型识别准确度的影响。(5)隐马尔科夫模型(HMM)的参数估计是其应用于识别问题时能否达到较高的准确率的关键。传统的Baum-Welch算法有诸多缺陷,I上海交通大学硕士学位论文基于SegmentalK-Means(SKM)的训练算法,与Baum-Welch算法相比,不仅可以降低运算的复杂度,收敛速度也较快,而且该算法更侧重于对模型的输出模式进行自动分类识别。因此,对点击欺诈识别问题,SKM算法更有针

6、对性,适用性更强。实证分析也表明,SKM训练算法对于点击欺诈的识别效果更好。此外,本文初步探讨了基于MCMC的Gibbs抽样法的HMM参数估计方法。关键词:点击欺诈;连续隐马尔科夫模型;Baum-Welch算法;SKM算法;马尔科夫蒙特卡洛模拟(MCMC);II上海交通大学硕士学位论文THEAPPLICATIONOFCONTINUOUSHIDDENMARKOVMODELINCLICKFRAUDIDENTIFICATIONABSTRACTWiththevigorousdevelopmentofsearchengi

7、nekeywordadvertisingmarketingmode,clickfraudhasbecameabigproblemtoplagueadvertiserandsearchenginecompanies.Howtoidentifyandpreventclickfraudhasalsobecamethefocusofallthefamousscholars'research.Inthispaper,weanalyzedtheclickfraudproblemsofonlinekeywordadverti

8、singanditsbehaviorcharacteristics.AstheclickbehaviorofkeywordadvertisingisinlinewiththebasicassumptionsofHMM,wearetryingtoapplythetheore-ticalframeworkofHMMinclickfraudidentification.Themainwork

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。