基于多源数据融合的微博用户兴趣挖掘方法

基于多源数据融合的微博用户兴趣挖掘方法

ID:35063816

大小:2.56 MB

页数:61页

时间:2019-03-17

基于多源数据融合的微博用户兴趣挖掘方法_第1页
基于多源数据融合的微博用户兴趣挖掘方法_第2页
基于多源数据融合的微博用户兴趣挖掘方法_第3页
基于多源数据融合的微博用户兴趣挖掘方法_第4页
基于多源数据融合的微博用户兴趣挖掘方法_第5页
资源描述:

《基于多源数据融合的微博用户兴趣挖掘方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于多源数据融合的微博用户兴趣挖掘方法MICROBLOGUSERINTERESTSMININGMETHODBASEDONMULTI-SOURCEDATAFUSION高健明哈尔滨工业大学2016年6月国内图书分类号:C931.6学校代码:10213国际图书分类号:308密级:公开管理学硕士学位论文基于多源数据融合的微博用户兴趣挖掘方法硕士研究生:高健明导师:芦鹏宇副教授申请学位:管理学硕士学科:管理科学与工程所在单位:经济与管理学院答辩日期:2016年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:C931.6U.D.C

2、:308DissertationfortheMasterDegreeinManagementMICROBLOGUSERINTERESTSMININGMETHODBASEDONMULTI-SOURCEDATAFUSIONCandidate:GaoJianmingSupervisor:Prof.LuPengyuAcademicDegreeAppliedfor:MasterofManagementManagementScienceandSpecialty:EngineeringAffiliation:SchoolofManagementDateofDe

3、fense:June,2016Degree-Conferring-Institution:HarbinInstituteofTechnology:哈尔滨工业大学管理学硕士学位论文摘要随着互联网的快速发展,社交网络得到人们的广泛认可。在国内社交网络方面,越来越多的人开始通过微博发布信息,而微博网站也成为主流海量信息的发布体,对微博的研究也从显性的兴趣标签到微博本身潜在的内容进行主题挖掘。LDA(latentDirichletallocation)模型是近几年比较流行的一种非监督的主题模型,已经有一些研究通过在Twitter数据集上对LDA模型进行主

4、题挖掘,但在中文微博的主题挖掘上的研究并不多。基于微博内容的用户兴趣挖掘可以获得较为精准的挖掘结果,但会面临冷启动和数据稀疏问题。基于交互关系的用户兴趣挖掘方法和基于交互信息的用户兴趣挖掘方法可以从两个不同的角度弥补基于微博内容的用户兴趣挖掘方法的缺陷。本文爬取新浪微博用户不同层次的数据用于进行多源数据融合微博用户兴趣建模研究。主要研究成果包括以下几个方面:首先,结合传统LDA模型提出一种适合中文微博的有监督的兴趣主题挖掘模型,即基于内容主题挖掘微博生成模型CTM-LDA。该模型有效的利用了先验主题信息,根据微博用户信息及用户原创内容相融合挖掘微

5、博用户兴趣主题。其次,利用基于交互关系和交互信息的等信息源分别构建兴趣模型,利用交互关系矩阵和关注人兴趣标签以及词语间相似度生成关注人兴趣主题。最后,针对微博自定义内容,话题微博,交互信息,以及用户自定义标签等不同数据进行实验,构建微博用户兴趣模型,研究并设计了多源数据融合的用户兴趣模型,利用空间向量构建出用户最终的兴趣主题。本文提出了不同数据源的微博用户兴趣融合模型,通过研究发现可以有效利用用户之间的交互关联关系的信息对微博用户进行兴趣主题挖掘,且融合模型的效果要更优。未来通过用户的兴趣模型可有针对性的对微博用户进行个性化推荐,该模型可推广到其

6、他社会媒体网站平台,对于企业而言具有一定商业研究价值。关键词:微博;用户兴趣模型;LDA;主题特征-I-哈尔滨工业大学管理学硕士学位论文AbstractWiththerapiddevelopmentofInternet,socialnetworkswidelyrecognizedallovertheworld.Intermsofdomesticsocialnetworks,moreandmorepeoplebegintoMicroblogreleaseinformation,thesitehasbecomethemainstreamofhugea

7、mountsofinformationrelease,thestudyofMicroblogalsofromexplicitinteresttagstominingMicroblogitselftothecontentofthepotentialthemes.LDA(latentDirichletallocation)modelismorepopularinrecentyears,akindofsupervisionandthethemeofthemodel,therehavebeensomestudiesbytheLDAmodelonTwitt

8、erdatasetthemedigging,butresearchonthethemeofChineseMicroblogminingi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。