微博垂直领域的数据挖掘

微博垂直领域的数据挖掘

ID:28343699

大小:2.31 MB

页数:47页

时间:2018-12-09

微博垂直领域的数据挖掘_第1页
微博垂直领域的数据挖掘_第2页
微博垂直领域的数据挖掘_第3页
微博垂直领域的数据挖掘_第4页
微博垂直领域的数据挖掘_第5页
资源描述:

《微博垂直领域的数据挖掘》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、.题目微博垂直领域的数据挖掘姓名叶浚源学号20091004054所在学院思科信息学院年级专业2009级计算机科学与技术指导教师蒋盛益职称教授完成时间2013年4月20日-..综合评定成绩:指导教师评语(可另附A4纸):评定成绩:指导教师签名:日期:答辩小组意见(可另附A4纸):评定成绩:答辩小组长签名:日期:-..微博垂直领域的数据挖掘——以广东外语外贸大学用户群为研究对象叶浚源思科信息学院2009级计算机科学与技术摘要:近年来,微博已发展成为网上最热门的应用之一。到目前为止,国内最热门的新浪微博已拥有几亿注册用户。大量用户的涌入使微博形成了各种垂直细分领域,譬

2、如某种职业的用户,某个学校的学生等。为了更好地了解微博,除了对其进行整体的研究外,对特定垂直领域进行研究同样具有现实意义与挑战性。本文以新浪微博上广东外语外贸大学相关用户群为研究对象,通过定向数据采集,获取相关用户信息与关系链。计算用户PeopleRank值,基于统计发现用户群热门标签以及使用Gephi进行网络可视化,展示了该垂直领域内用户群的基本情况。关键词:微博;垂直领域;数据采集;PeopleRank;网络可视化-..DatamininginMicro-blogverticalspecificusersgroupbasedontheusersinGuang

3、dongUniversityofForeignStudiesYeJunYuanCiscoSchoolofInformaticsAbstract:Inrecentyears,micro-bloggraduallybecomesoneofthemostpopularonlineapplications.Nowadays,therearehundredsofmillionsusersgatheringinthemostpopularSinaMicro-blog.Withthegrowthofthenumberofusers,suchlikeagroupofstuden

4、tsinthesameschooloragroupofpeoplewithsameoccupation,kindsofspecificusersgroupsformed.Therefore,forabetterresearchinMicro-blog,topayattentionintheseverticalfieldsisalsosignificantandchallenging.Inthispaper,I’mfocusedonuserswhorelatedGuangdongUniversityofForeignStudiesinSinaMicro-blog.

5、Viadatacollection,Igetsomeusers’personalinformationandtheirfriendships.ThenIcalculatetheirPeopleRank,countforthegroup’shottagsanduseGephitovisualizethenetwork.Asaresult,itshowstheverticalspecificusersgroup’sbasicoverview.Keywords:Micro-blog;VerticalSpecificUsersGroup;Datacollection;P

6、eopleRank;Networkvisualization-..目录摘要IABSTRACTII1绪论11.1微博概述11.2当前国内微博研究的现状11.3本课题研究的目的及意义21.4本课题工作简介22工作总体设计32.1系统设计框架图32.2工作模块简介33定向微博数据采集53.1采集数据的类型53.2数据存储63.3两种采集方式113.4采集模块的设计与实现183.5数据采集成果194数据预处理194.1垃圾信息的清理194.2广东外语外贸大学相关用户识别194.3垂直领域内用户网络的构建205垂直领域内用户重要度计算225.1PageRank简介225.

7、2PageRank计算方法225.3借鉴PageRank的思想计算用户PeopleRank225.4广外相关用户网络PeopleRank计算236垂直网络内用户热门标签发现246.1用户标签挖掘分析246.2基于统计发现广外用户群热门标签247基于GEPHI的网络可视化257.1Gephi简介257.2数据导入267.3网络分析277.4网络可视化308挖掘结果展示338.1展示系统框架图33-..8.2各模块介绍339结语与展望369.1本文工作总结369.2本文工作的优点、特色与不足379.3进一步工作展望38参考文献38致谢39-..1绪论1.1微博概述微

8、博,即微型博客(Micr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。