基于转发层次分析的新浪微博热度预测研究-论文.pdf

基于转发层次分析的新浪微博热度预测研究-论文.pdf

ID:53030024

大小:658.66 KB

页数:5页

时间:2020-04-14

基于转发层次分析的新浪微博热度预测研究-论文.pdf_第1页
基于转发层次分析的新浪微博热度预测研究-论文.pdf_第2页
基于转发层次分析的新浪微博热度预测研究-论文.pdf_第3页
基于转发层次分析的新浪微博热度预测研究-论文.pdf_第4页
基于转发层次分析的新浪微博热度预测研究-论文.pdf_第5页
资源描述:

《基于转发层次分析的新浪微博热度预测研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第4l卷第7期计算机工程2015年7月VO1.41NO.7ComputerEngineeringJuly2015·先进计算与数据处理·文章编号:1000-3428(2015)07~031-05文献标识码:A中图分类号:TP311.5基于转发层次分析的新浪微博热度预测研究翟晓芳,刘全明,程耀东,胡庆宝,李海波(1.山西大学计算机与信息技术学院,太原030006;2.中国科学院高能物理研究所计算中心,北京100049)摘要:微博作为新型的消息传播媒介,其影响力和传播速度都超越了传统主流媒体,预测微博热度对舆情监测、政府宣传

2、、企业营销及热点推送等具有重要意义。通过分析微博转发的层次规律,结合转发量、转发深度及广度指标,定义新的热度指数计算方法。将微博热度划分为5个等级,对转发数大于100的微博预测其热度达到特定等级的概率。使用有监督的机器学习算法,先后提取训练样本的静态和动态特征训练热度预测模型。通过自主开发的BigData爬虫开放平台获取来源于新浪微博的训练样本,并应用十折交叉验证法进行实验,结果表明,相比只使用静态特征的热度预测模型,加入微博动态特征能有效提高预测性能,平均F1值达到76.9%关键词:微博;爬虫;静态特征;动态特征;热

3、度指数;多分类问题中文引用格式:翟晓芳,刘全明,程耀东,等.基于转发层次分析的新浪微博热度预测研究[J].计算机工程,201541(7):31—35.英文引用格式:ZhaiXiaofang,LiuQuanming,ChengYaodong,eta1.ResearchonHotnessPredictioninSinaMicroblogBasedonForwardLevelAnalysis[J].ComputerEngineering,2015,41(7):31—35ResearchonHotnessPredictioni

4、nSinaMicroblogBasedonForwardLevelAnalysisZHAIXiaofang,LIUQuanming,CHENGYaodong,HUQingbao,LIHaibo(1.CollegeofComputer&InformationTechnology,ShanxiUniversity,Taiyuan030006,China;2.ComputingCenter.InstituteofHighEnergyPhysics,ChineseAcademyofSciences,Beijing100049,

5、China)【Abstract】Microblogisanewtypeofnewsmedia,anditsinfluenceandpropagationspeedsurpassestraditionalmajormedia.Therefore,ithasagreatimportancetopredicthotnessinmicroblogforpublicopinionmonitoring,governmentpropaganda,corporationmarketingandpopularissuespushing.

6、Throughanalyzingmicroblogforwardlevelwhichcombiningtheeffectsoftheforwardindex,forwarddepthandbreadthindex,thispapergivesanewdefinitionofcalculatingthehotnessindexofmicroblog.Thendependonthisdefinition,thehotnessindexofthemicroblogisclassifiedasfivelevels.Thegoa

7、listopredictthehotnessofmicroblogwhoserepostcountisover100toachieveaspecifiedleve1.Byusingsupervisedmachinelearningalgorithm,itsuccessivelyextractsthestaticattributesanddynamicrepostcharacteristicsofthetrainingsamplestotrainhotnesspredictionmode1.Thetrainingsamp

8、lesisfromSinamicroblogiscaughtbyusingself—developedBigDataopencrawlerplatform.Experimentalresultbyusing10一foldcross—validationshowsthat,comparedwithhotnesspredictionm

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。