基于文本数据挖掘的微博情感-分析和监控系统

基于文本数据挖掘的微博情感-分析和监控系统

ID:34186893

大小:1.32 MB

页数:60页

时间:2019-03-04

基于文本数据挖掘的微博情感-分析和监控系统_第1页
基于文本数据挖掘的微博情感-分析和监控系统_第2页
基于文本数据挖掘的微博情感-分析和监控系统_第3页
基于文本数据挖掘的微博情感-分析和监控系统_第4页
基于文本数据挖掘的微博情感-分析和监控系统_第5页
资源描述:

《基于文本数据挖掘的微博情感-分析和监控系统》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、浙江工业大学硕士学位论文基于文本数据挖掘的微博情感分析与监控系统摘要近年来,随着互联网深入发展,移动终端技术逐渐成熟,社交网络已融入人们日常生活,越来越多的网民在社交网络上抒发个人情感、点评社会热点等,社交网络舆情分析有着至关重要的作用,受到学术界和产业界的普遍关注。微博作为一种新型社交网络,为用户提供了一种随时随地分享和获取信息的新型网络交流平台,微博用户数量逐年攀升,对微博数据进行情感分析,能够挖掘出微博用户对社会事件的观点想法,追踪事件的发展态势,进而更有利于舆情监控、谣言控制等工作的开展。为了更好实现微博数据情感分析和舆情分析目标,本文对微博进行细粒度情感分析,将情感类别划分为

2、高兴、喜好、悲伤、愤怒、厌恶、恐惧、惊讶这七种类别。通过分析微博情感研究现状,并结合微博自身特性,本文提出了融合微博显性和隐性特征的情感聚类方法,开发了微博情感分析与监控系统,主要研究内容包括以下几个方面:1)分析微博短文本特性,提出了微博显性情感特征,主要包括微博自带表情符号、情感词,设计构建了表情符号词典与情感词典,并扩展了网络词语情感词典,充分考虑微博显性情感特征,将这些显性情感特性进行频繁挖掘,获取的情感特征项可以更好地保留原始微博的情感特征。2)提出了基于频繁项集语义隐性情感特征的聚类方法,充分考虑微博中语义这个隐性情感特征,首先基于显性情感特征定义微博频繁特征词集,利用最大

3、频繁项集获得初始情感簇;针对初始簇间存在文本重叠情况,提出基于短文本扩展语义隶属度的簇间重叠消减算法,获得完全分离的初始簇;根据簇语义相似度矩阵,给出凝聚式情感聚类方法。最后,通过NLP&CC2013评测提供的训练语料数据验证文本方法的有效性。3)开发了微博情感分析与监控系统,并在“马航”事件真实微博数据集进行分析,验证了本文方法的微博情感分析与监控能力,同时还将情感分析结果进行了可视化展示。关键词:微博,情感分析,细粒度,频繁项集,文本聚类i万方数据浙江工业大学硕士学位论文MICROBLOGSENTIMENTANALYSISANDMONITORINGSYSTEMBASEDONTEXT

4、DATAMININGABSTRACTInrecentyears,withthefurtherdevelopmentoftheInternetandthematurationofmobileterminaltechnology,thesocialnetworkhasbeenintegratedintopeople'sdailylives.Moreandmoreusersexpresspersonalfeelings,commentsandothersocialhotspotsonthesocialnetworks.Socialnetworkanalysishasavitalroleinp

5、ublicopinionanalysis,havingawidelyspreadconcernfromacademiaandindustry.Microblogprovidesusersanewnetworkcommunicationplatform,toshareandaccessanytimeandanywhere.Thenumberofusershasincreasedsteadily.Microblogcontainingdifferentemotionalcharacteristicstendstobesentimentanalysis,whichcandigoutthemi

6、croblogusers’pointorideaonsocialevents,alsocanbetrackedonthedevelopmenttrendofevents.Thusitisconducivetomonitoringpublicopinion,rumorcontrolandsoon.Inordertoachieveemotionalmicrobloganalysisandpublicopinionanalysispurposes,thisarticletakefine-grainedsentimentanalysis,dividingthesentimentintohapp

7、y,likeness,sadness,anger,disgust,fear,surprisethesesevencategories.Byanalyzingthemicroblog’suniquecharacteristicsandshorttextemotionresearchstatus,thispaperproposedamicroblogemotionalclusteringmethod.Basedontheintegrationofe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。