多关系社交网络下恶意用户行为分析及特征构造研究

多关系社交网络下恶意用户行为分析及特征构造研究

ID:34312709

大小:1.32 MB

页数:49页

时间:2019-03-04

多关系社交网络下恶意用户行为分析及特征构造研究_第1页
多关系社交网络下恶意用户行为分析及特征构造研究_第2页
多关系社交网络下恶意用户行为分析及特征构造研究_第3页
多关系社交网络下恶意用户行为分析及特征构造研究_第4页
多关系社交网络下恶意用户行为分析及特征构造研究_第5页
资源描述:

《多关系社交网络下恶意用户行为分析及特征构造研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码:10327学号:1120150625硕士学位论文多关系社交网络下恶意用户行为分析及特征构造研究院系:信息工程学院专业:计算机应用技术研究方向:数据挖掘姓名:殷珺指导教师:伍之昂完成日期:2018.05.29答辩日期:2018.05.30SPAMMERBEHAVIOURANALYSISANDFEATURECONSTRUCTIONINMULTI-RELATIONALSOCIALNETWORKSADissertationSubmittedtoNanjingUniversityofFinanceandEconomicsFortheAcademicDegreeofMasterofEngine

2、eringBYYinJunSupervisedbyProfessorWuZhiangSchoolofInformationEngineeringNanjingUniversityofFinanceandEconomicsMay2018学位论文独创性声明本论文是我个人在导师指导下进行的研究工作及取得的研究成果。论文中除了特别加以标注和致谢的地方外,不包含其他人或其它机构已经发表或撰写过的研究成果。其他同志对本研究的启发和所做的贡献均已在论文中作了明确的声明并表示了谢意。作者签名:日期:学位论文使用授权声明本人完全了解南京财经大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允

3、许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其它复制手段保存论文。保密的论文在解密后遵守此规定。作者签名:导师签名:日期:摘要电子商务平台和社交网络平台的蓬勃发展,用户越来越借助于各类评论信息作出决策,这导致虚假和欺诈信息大量出现,发布虚假评论和欺诈信息的人通常被称为恶意用户。近年来,恶意用户检测已经成为学术界和工业界关注的热点问题。由于电子商务平台数据类型丰富,如评分、评论内容、发布评论时间等,主流的检测方法依托上述数据构建行为特征,再利用机器学习方法训练分类器。然而,社交网络以交互关系数据为主,数据类型相对匮乏,因此,社交网络的恶意用户检测需要“依赖于关系数

4、据但独立于内容数据”的检测框架。已有的研究尝试从交互关系上定义复杂网络特征(如度、K-Core、PageRank、连通分量等)及交互序列特征,隐含在多关系网络中的深层次语义信息未能获得充分利用。有鉴于此,本文的研究旨在充分挖掘隐含在异质关系网络中的深层次语义信息,从而定义出基于关系网络数据的一系列行为特征及隐特征。以真实社交网络Tagged.com多关系数据集为支撑,本文主要进行了以下两个方面的研究:1.基于非内容数据,充分挖掘隐含在异质关系网络中的深层次语义信息,从而定义出基于关系网络数据的一系列行为特征指标。由于Tagged数据集中没有公开发布关系属性对应的关系类型名称,所以我们首先根据

5、数据集中关系属性的数据特征,结合Tagged.com网站实际公布的关系类型的特点,分析推测出各个关系属性对应的实际关系类型名称。接着,在各个关系上,结合实际关系类型意义,对比分析恶意用户和正常用户的行为模式差异,并基于非文本的数据信息,如活跃时间段、发送/接受比例、发送后得到回复的比例等,定义出符合关系网络数据特性的一系列行为特征指标。最后,依托于数据集中提供的每个用户的真实标记信息验证了特征指标在表征恶意用户与正常用户行为差异中的有效性。2.提出了一种新的“发送-接收”角色分离的图嵌入模型用于抽取和融合异质关系上的隐特征。首先用点代表用户,边代表用户间发生的关系在一个共享的嵌入空间中构建图

6、。其次,提取各关系上发送方到接收方的交互次数做为交互向量,接着构建发送方特征矩阵与接收方用户特征矩阵,并以点积表示用户-用户交互向量,以这两种向量的差异性来拟合概率矩阵分解模型,并加入约束条件防止优化过程中的过拟合问题。最后通过多关系拼接方法获取每个用户在多关系社交网络中的隐特征。交叉验证的结果显示,本文提出的模型所提取的隐特征,对多关系社交网络中恶意用户的检测性能有显著贡献。关键词:恶意用户检测;多关系社交网络;行为分析;特征构造;隐特征IABSTRACTWiththerapiddevelopmentofe-commerceplatformandsocialnetwork,usersare

7、increasinglyusingvariouskindsofinformationfromcommentstomakedecisions.Thisleadstotheemergenceoffalseandfraudulentinformation.Peoplewhopublishfalsecommentsandfraudulentinformationareusuallycalledspammers.Inr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。