基于内容移动社交网络审计研究引擎

基于内容移动社交网络审计研究引擎

ID:32636800

大小:64.42 KB

页数:13页

时间:2019-02-14

基于内容移动社交网络审计研究引擎_第1页
基于内容移动社交网络审计研究引擎_第2页
基于内容移动社交网络审计研究引擎_第3页
基于内容移动社交网络审计研究引擎_第4页
基于内容移动社交网络审计研究引擎_第5页
资源描述:

《基于内容移动社交网络审计研究引擎》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于内容移动社交网络审计研究引擎摘要:随着移动互联网的飞速发展以及社会化网络的出现,微信等移动社交类应用在生活的各个层面为人们带来便利,但同时也带来了谣言、泄密等网络安全问题。传统的基于字符串匹配的关键词过滤审计引擎已经不能满足人们的需求。针对传统特征项权重算法在处理变异短文本方面的不足,提出了改进的TF-IDF算法,同时将社会网络计算的相关技术应用到审计引擎中,实现了基于内容的事件抽取和表达。实验结果表明,改进后的算法具有较高的准确率和召回率。关键词:社会计算;内容审计;TF-IDF;事件分析中图分类号:TP393文献标识码:A文章编号:1009

2、-3044(2014)10-2423-05Abstract:WiththerapiddevelopinentofMobileInternetandSocialNetworking,convenienceisbroughtbymobilesocialnetworkingapplications,suchasWeChat,inallaspects.Thusrumors,leaksandothernetworksecurityissuesarebroughtaswellasconvenient.However,thetraditionalauditeng

3、inebasedonstringmatchingandkeywordfilteringdidn,tmeetpeople'sneedsanymore.TheimprovedTF-IDFalgorithmisproposedbasedonitsinadequateindealingwithabnormalshorttexts.Therelevantsocialnetworkcomputingtechnologiesareappliedinauditenginetorealizetheanalysisofeventsituationbasedoncont

4、ent・ResuItshowsthattheimprovedalgorithmhashigherrecallrateandaccuraterate,comparedwiththetraditionalTF-IDFalgorithm.Keywords:socialcomputing;contentaudit;TF-IDF;eventanalysis随着智能手机、手持游戏机、平板电脑以及许多工业级别PAD(PortableDigitalAssistant,便携式数字助理)等的普及,微信、Facebook以及Twitter等SNS(SocialNetwo

5、rkingServices,社会性网络服务)应用在社会的各个层面为人们提供越来越多的便利。微信是腾讯公司于推出的一款通过移动网络快速发送语音短信、视频、图片和文字,支持多人群聊的社交信息平台。2013年10月23日,微信宣布其注册用户超过6亿。由此可见,以微信为代表的移动社交网络类应用正受到越来越多网民的喜爱。移动社交网络类应用缩短了交友的距离,节省了社交成本,但是同时也带来了一系列服务和管理的问题。在移动互联网中,虚拟社会与现实有着强烈的联系,如何在海量的数据中挖掘用户的消费倾向性和意图、更好的服务大众以及提升商业智能是当下亟需解决的问题。同时,

6、由于缺乏有效的监督和管理,网络中掺杂着许多不健康甚至恶意的内容,带来了不安定的因素。企业和政府人员通过互联网进行泄密获活动;不法分子发布“食盐抵御核辐射”、"服贸协议是黑箱作业”、“食物传染艾滋病”等网络谣言,这些非法信息、反动言论给社会秩序的安定有序甚至国家的发展带来不可忽视的威胁。因此,基于统计特征和内容特征解决网络内容所引起的安全问题已经迫在眉睫。本文设计和实现了一种基于内容的移动社交网络审计分析引擎,针对微信等移动社交网络类应用的数据内容进行审计分析,并将其与社会网络计算结合起来,以实现对移动互联网信息内容传播的有效监控,防止内部机密或敏感

7、数据非法泄露和传送,提供有关网络通信手段滥用的有力证据。1相关研究传统的基于内容的网络审计分析系统主要针对日志、电子邮件、博客、短信和微博等进行审计。这些审计系统又分为两大类:电子邮件、日志和博客这类具有一定的结构和规范的普通文本,以及短信、即时消息、微博等语法格式不规范,形式比较随意的变异短文本。针对电子邮件的审计系统通常通过捕获和还原网络数据包获取数据,同时基于预先定义好的规则,利用单模或者多模匹配算法分别对邮件头或者正文部分进行关键词过滤[1,2]o在传统的互联网中,很多人喜欢使用博客分享自己的各种信息,博文以及评论的内容都可以作为审计的对象

8、。通过建立人物关系模型,描述群体的结构关系,实现用户兴趣的快速发现,进行个性化推荐[3]。与传统互联网相比,微信等移动互联

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。