中文微博的话题检测及微博预警

中文微博的话题检测及微博预警

ID:26717397

大小:3.30 MB

页数:94页

时间:2018-11-28

中文微博的话题检测及微博预警_第1页
中文微博的话题检测及微博预警_第2页
中文微博的话题检测及微博预警_第3页
中文微博的话题检测及微博预警_第4页
中文微博的话题检测及微博预警_第5页
资源描述:

《中文微博的话题检测及微博预警》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、申请上海交通大学专业学位硕士论文中文微博的话题检测及微博预警学校:上海交通大学院系:信息安全工程学院硕士生:谢婧班级:B1003692学号:1100369037专业:电子与通信工程导师:刘功申(副教授)上海交通大学信息安全工程学院2012年12月万方数据ADissertationSubmittedtoShanghaiJiaoTongUniversityforMasterDegreeofEngineeringTopicDetectionandTweet’sTrendsWarningforChineseMicroblogAuthor:JingXieSpecialty

2、:ElectronicsandCommunicationEngineeringAdvisor:AssociateProf.GongshenLiuSchoolofInformationSecurityEngineeringShanghaiJiaoTongUniversityShanghai,P.R.ChinaDecember,2012万方数据上海交通大学专业硕士学位论文摘要中文微博的话题检测及微博预警摘要随着移动互联网技术的发展,微博已经成为一种新兴的网络媒体,信息通过微博可以得到快速传播及扩散,对微博上的话题传播、检测及预警技术的研究也变得至关重要。本文首先研究

3、了微博的用户关系网络模型、话题传播模型及话题传播特点,而后基于以上研究结果,提出了一种中文微博的话题检测算法及微博预警算法。对中文微博的话题检测算法,本文优化了话题检测中的预处理、特征选取、文本表示、权重计算等步骤,并提出了一种微博计分方式,认为得分小于预设阈值的微博属于噪声数据,首先对微博集中的噪声数据进行初步筛除,而后基于Single-Pass增量式话题聚类算法进行改进,提出了针对中文微博的话题聚类算法,该聚类算法采用了一种新的距离计算方法及中心向量更新算法,实验结果表明该算法可以有效地筛除大量话题无关的噪声微博,并能准确地从微博集中发现热点话题,同时将微博

4、归类到正确的话题簇中。对微博的预警算法,本文提出了微博转发链关键点预测算法及用户对微博的转发行为预测算法,并采用以上两种预测算法进一步给出了话题微博的预警算法。本文通过预测微博转发链的关键点及潜在关键点的转发行为及被转发量,预估出微博下一时间窗的转发量,对转发量超过阈值的微博进行预警,实验表明,转发链关键点预测算法及用户转发行为预测算法都具有较高的准确率,而微博预警算法也可以有效地预测出可能发生大转发量的微博,从而可以提前对这些微博作出预防措施,有效地控制信息在网络上的传播和扩散。微博的热点话题检测可以帮助用户快速了解目前的热点话题、热门I万方数据上海交通大学专

5、业硕士学位论文摘要事件,也能够帮助政府及时了解社会动态、知道民众的想法。而发现了微博中的热点话题后,进一步对话题中某些可能引发大转发量的微博进行提前的预警,可以帮助政府提前对微博上的信息传播进行有效地干预,加大或缩小信息的传播范围。关键词:微博,传播模型,话题检测,增量式聚类,关键点用户,贝叶斯预测,预警II万方数据上海交通大学专业硕士学位论文ABSTRACTTopicDetectionandTweet’sTrendsWarningforChinese MicroblogABSTRACTWiththedevelopmentofmobilenetworktechn

6、ology,microbloghasbecomeanemergingnewkindofmedia.Informationspreadrapidlythroughmicroblog.Therefore,thestudyoftopicspreading,detectionandwarningtechnologyformicrobloghasbecomeanimportantissue.Thispaperstudiedtheuserrelationshipmodel,topicpropagationmodelandtopicpropagationcharacteris

7、ticsformicroblogfirstly,andthenproposedatopicdetectionmodelforChinesemicroblogandatweetwarningmodel.FortopicdetectionalgorithmforChinesemicroblog,thispaperoptimizedthedatapretreatment,featureselection,textexpressionandweightcomputingpart,thenproposedanewscoringmethodfortweets.Weconsi

8、deratweetbel

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。