中文微博信息可信度分析方法的研究

中文微博信息可信度分析方法的研究

ID:32286895

大小:10.23 MB

页数:62页

时间:2019-02-02

中文微博信息可信度分析方法的研究_第1页
中文微博信息可信度分析方法的研究_第2页
中文微博信息可信度分析方法的研究_第3页
中文微博信息可信度分析方法的研究_第4页
中文微博信息可信度分析方法的研究_第5页
资源描述:

《中文微博信息可信度分析方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据学位论文版权使用授权书本人完全了解北京信息科技大学关于收集、保存、使用学位论文的规定,按照学校要求提交学位论文的印刷本和电子版本。学校有权保留学位论文并向中国科学技术信息研究所等国家主管部门或其指定机构送交论文的电子版和纸质版,允许论文被查阅和借阅,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。学校有权适当复制、公布论文的全部或部分内容。学校有权将本人的学位论文加入《中国优秀硕士学位论文全文数据库》和编入《中国知识资源总库》。I.-学位论文作者签名:渺有松砂炒年f月2日’口公开口保密(——年——月)(保密的学位论文在解密后应

2、学位论文作者签名:岗嗽砌心年雩月,。日ZD/S年/月≥日万方数据硕士学位论文原创性声明本人郑重声明:所呈交的论文题目为《中文微博信息可信度分析方法研究》学位论文,是本人在导师指导下,进行研究工作所取得的成果。尽我所知,除了文中特别加以标注的内容外,本学位论文的研究成果不包含任何他人创作的、己公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均己在文中以明确方式标明并表示了谢意。本学位论文原创性声明的法律责任由本人承担。储擗交,1触分类号:瑚选错明单位代码:11232万方数据摘要伴随着互联网的普及与技术发

3、展的日新月异,中国第一代微型博客服务提供商——饭否、叽歪面世以来,微博凭借其便捷性、“背对脸”形式、原创性、草根性迅速发展成为社交网络中的“宠儿”。微博用户可在任何场合下分享自己看到的、听见的、想到的人或事,而约束效力很低的微博容易造成虚假信息的泛滥。如何深度挖掘微博用户的特征信息,设计相应的实现算法,建立判定模型,为政府部门在甄别信息、理清思想、引导思潮、防止虚假信息传播等方面具有重要的现实意义。在微博可信度分析方法的研究中,本文从统计学中的指标体系方向与机器学习中的分类算法思路分别进行了研究,目标是研究对微博信息可信度进行精确判定的技术

4、与方法。针对可计算用户信息的权威值与短文本微博结构与内容的独特性,构建用户信息可信度模型与微博内容可信度模型,并对这两个模型的重要性进行探讨,实现对两个模型的整合,最后建立一套微博信息可信度评价系统,该系统能够根据提交的微博用户以及用户所发的微博信息,自动评价该微博的可信度。研究的重心主要包括5个方面:1)实现微博数据采集方案,并详细论述了微博用户信息及微博内容的预处理。分析了基于传统网页与新浪平台SDK采集技术的优缺点,实现网页采集与模拟用户登录相结合的数据采集技术;对采集的微博用户信息进行指标选取、用户可信度特征分析等预处理工作,并对微

5、博内容所提取的情感与谣言分类特征进行定性与定量处理。2)利用指标体系建立用户信息可信度模型。从用户信息数据中,选择性的提取用户的完整度、活跃度、交际广度、传播力度四项指标组成指标体系;然后利用设计的层次分析法(AHP)结构模型,实现了对指标的权重系数数值确定,计算出每个微博用户的权威值。最终完成对用户信息可信度模型的构建。3)多层分类器组合实现微博内容可信度模型。首先对词语进行倾向极性判别;其次提取微博文本的一元词与二元词作为贝叶斯情感分类的特征集,分类的结果结合微博的其他八项谣言分类特征(话题数、@标签数、表情符号数等)作为SVM分类器的

6、特征集,分类结果是判断每一条微博是否为谣言。最终实现微博内容可信度模型的构建。4)构建中文微博信息可信度综合评价模型。以用户信息可信度模型与微博内容可信度模型对用户信息的计算结果作为指标,计算两项指标对应的权重系数。最后实现中文微博信息可信度评价模型。5)综合以上结论与研究成果,设计并实现中文微博可信度评价系统。阐述了各个子模块的设计分析与功能实现。关键词:信息可信度;微博;层次分析法;多层分类器万方数据ABSTRACTAlongwiththepopularizationanddevelopmentofinternettechnologyc

7、hangerapidly,andsinceJiwaiandFanfouliketheTwitterwebsiterepresentedthefirstgenerationofChinesemicrobloggingserviceavailable,micro-blogwithitsconvenience,”backtotheface”form,originality,grassrootsquicklydevelopedintoasocialnetworkinthe”pet”,theuserCansharewhattheysee,hearan

8、dfeelwheneverandwherever.Floodingandbindinginverylowmicro-blogeasilyleadtofalseinformatio

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。