基于机器学习的微博评论信息倾向性分析的研究

基于机器学习的微博评论信息倾向性分析的研究

ID:35066351

大小:2.26 MB

页数:72页

时间:2019-03-17

基于机器学习的微博评论信息倾向性分析的研究_第页
预览图正在加载中,预计需要20秒,请耐心等待
资源描述:

《基于机器学习的微博评论信息倾向性分析的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于机器学习的微博评论信息倾向性分析的研究RESEARCHONTHEANALYSISOFWEIBOCOMMENTSTENDENCYBAESDONMACHINELEARNINGMETHODS汪淳哈尔滨工业大学2016年6月国内图书分类号:TP393学校代码:10213国际图书分类号:621.3密级:公开工学硕士学位论文基于机器学习的微博评论信息倾向性分析的研究硕士研究生:汪淳导师:李东教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2016年6月授予学位单位:哈尔滨工业大学ClassifiedInde

2、x:TP393U.D.C:621.3DissertationfortheMasterDegreeinEngineeringRESEARCHONTHEANALYSISOFWEIBOCOMMENTSTENDENCYBAESDONMACHINELEARNINGMETHODSCandidate:WangChunSupervisor:Prof.LiDongAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnologyAffiliation:Schoolo

3、fComputerScienceandTechnologyDateofDefence:June,2016Degree-Conferring-Institution:HarbinInstituteofTechnology摘要摘要本文的重点研究对象是微博评论信息的倾向性分析,主要的研究内容是以新浪微博中的评论为研究对象并且对评论中的情感倾向进行研究。本研究是将几种特征进行提炼、融合通过改进的机器学习方法来增强分类效果。情感分析在舆论监控、商品检验有着广泛的应用。基于此,本文提出一个设想,把评论划分成三种类型:垃圾评论、主观评论、客观评论。针对不同类型

4、的评论选取相应的方式进行分析,主观评论褒贬倾向是此研究分析的重点。本文首先对评论数据进行清理,剥离垃圾评论以及客观性评论。其中利用几种特征的有效融合并结合朴素贝叶斯、阈值划分等技术方法判断垃圾评论、客观评论,大大降低了文本的噪声。其次,针对文本褒贬倾向性分析,通过比较几种特征提取方法,并在其基础上改进情感词的选取方式和权值计算方式,构成新的文本向量空间。通过集成学习方法以及投票方式将传统的机器学习算法进行融合,达到更好的分析效果。本文实现了针对情感词的特征提取和权值计算的性能提升,使用AdaBoost、RandomSubspace、融合分类器组合

5、方式提升传统机器学习方法,提高评论分析的准确率。最后,通过性能评估方法说明本文的方法对评论分析具有很好地效果,同时本文针对评论的情感转移以及情感载体进行分析,判断褒贬数据集的情感载体异同,起到舆情分析预警作用。关键词:微博评论;机器学习;情感分析;特征融合;集成学习-I-AbstractAbstractThispaperfocusesonresearchobjectoforientationanalysisofWeibocomment.ThemainresearchcontentisXinlangmicrobloggingreviewsforth

6、estudyandtheemotionaltendency.Theresearchrefinesseveralfeaturesofthestudyandthroughimprovedintegrationofmachinelearningmethodstoenhancetheaccuracyofclassification.Sentimentanalysishasbeenwidelyusedinmonitoringpublicopinionandcommodityinspection.Basedonthis,thepaperproposesani

7、deathatdividesthecommentintothreetypes,whichcontainsspamcomments,subjectiveorobjectivecomments,andappraiseorcriticalcomments.Toselecttheappropriatemodeforanalysingdifferenttypesofcommentsdifferenttypesofcomments.Firstly,thepapercleanupthedataofcommentthatpeelsoffthespamcommen

8、tsandobjectivecomments.Thepaperuseseffectiveintegrationofseveralfeat

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。