欢迎来到天天文库
浏览记录
ID:27130815
大小:2.51 MB
页数:71页
时间:2018-12-01
《基于回应消息的微博情感分类-研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、...杭州电子科技大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。申请学位论文与资料若有不实之处,本人承担一切相关责任。论文作者签名:郭飞飞日期:2014年5月30日学位论文使用授权说明本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后,发表论文或
2、使用论文工作成果时署名单位仍然为杭州电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。(保密论文在解密后遵守此规定)论文作者签名:郭飞飞日期:2014年5月30日指导教师签名:王小华日期:2014年5月30日......杭州电子科技大学硕士学位论文摘要随着互联网Web2.0技术快速发展,微博成为继博客之后当下最流行的社交应用。微博以其方便、自由的形式,短期内便吸引了大量的网民。数以亿计的网民每天通过微博平台发布微博消息,这些海量消息均是来自网民自己的声音,含有丰富的情感内容信
3、息,可以通过挖掘这些情感内容信息来了解网民对社会热点事件、政府政策的态度,为用户、政府或企业提供决策支持。本文以新浪微博作为研究对象提出了针对中文微博的情感分类方法,主要做了以下工作内容。第一,本文使用采集的新浪微博消息,从统计学的角度对新浪微博消息内容长度、句子个数及微博中包含的链接、话题标签、表情符号、图片进行了定量分析。这些内容的分析和对比是分类方法中特征提取和算法设计的重要参考依据。第二,本文从语义规则角度提出了基于微博词典和回应消息的微博情感分类方法。该方法通过构建微博情感词典,结合回应消息对微博进行情感分类,同时对引入的回应消息设计了可度量计算方法。另外,
4、又提出了回应消息可信度的概念,主要用来衡量回应消息的真实性。第三,本文从机器学习角度提出了基于语义特征和回应消息的微博情感分类方法。该方法通过提取微博语义特征、微博元素特征及回应消息特征,利用向量空间模型表示分类特征向量,结合SVM分类算法实现分类模型,实现对中文微博的情感分类。最后,本文使用新浪微博作为训练和测试数据,针对提出的方法设计了多组实验,详细对比分析了各组实验结果。得出的结论是本文提出的分类方法是可行和有效的。关键词:情感分类,微博,回应消息,回应消息可信度,SVMI......杭州电子科技大学硕士学位论文ABSTRACTWiththerapiddevel
5、opmentofthetechnologiesofWeb2.0,themicro-blogbecomesthemostpopularsocialapplicationafterblog.Themicro-blogisveryconvenienceandfree,alotofpeopleareattractedbyitinshorttimeandwritealotofmessagesintheplatformofmicro-blogeveryday.Thesemessagesareallwrittenbythepeoplethemselves,sothemessages
6、areveryrichintheemotionalcontent.Theycanbeminedinordertoknowtheattitudestothehotissuesandthegovernment'spolicies,asaresultwecanofferthedecisionsupportstotheusers,governmentsandcompanies.ThepaperusestheSinamicro-blogastheresearchobject,andthenthefollowingjobsaredoneinordertoproposeasenti
7、mentclassificationmethodtotheChinesemicro-blog.Firstly,wecollectsomemicro-blogmessagesfromSina,thenthecontentlength,thenumberofsentences,thelinks,thelabels,theemoticonsandthepicturesinthemessagesareanalyzedfromthestatisticalperspective.Analysisandcomparisonofthesecontentsisimpo
此文档下载收益归作者所有