基于回应消息的微博情感分类-研究

基于回应消息的微博情感分类-研究

ID:27130815

大小:2.51 MB

页数:71页

时间:2018-12-01

基于回应消息的微博情感分类-研究_第1页
基于回应消息的微博情感分类-研究_第2页
基于回应消息的微博情感分类-研究_第3页
基于回应消息的微博情感分类-研究_第4页
基于回应消息的微博情感分类-研究_第5页
资源描述:

《基于回应消息的微博情感分类-研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、...杭州电子科技大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。申请学位论文与资料若有不实之处,本人承担一切相关责任。论文作者签名:郭飞飞日期:2014年5月30日学位论文使用授权说明本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后,发表论文或

2、使用论文工作成果时署名单位仍然为杭州电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。(保密论文在解密后遵守此规定)论文作者签名:郭飞飞日期:2014年5月30日指导教师签名:王小华日期:2014年5月30日......杭州电子科技大学硕士学位论文摘要随着互联网Web2.0技术快速发展,微博成为继博客之后当下最流行的社交应用。微博以其方便、自由的形式,短期内便吸引了大量的网民。数以亿计的网民每天通过微博平台发布微博消息,这些海量消息均是来自网民自己的声音,含有丰富的情感内容信

3、息,可以通过挖掘这些情感内容信息来了解网民对社会热点事件、政府政策的态度,为用户、政府或企业提供决策支持。本文以新浪微博作为研究对象提出了针对中文微博的情感分类方法,主要做了以下工作内容。第一,本文使用采集的新浪微博消息,从统计学的角度对新浪微博消息内容长度、句子个数及微博中包含的链接、话题标签、表情符号、图片进行了定量分析。这些内容的分析和对比是分类方法中特征提取和算法设计的重要参考依据。第二,本文从语义规则角度提出了基于微博词典和回应消息的微博情感分类方法。该方法通过构建微博情感词典,结合回应消息对微博进行情感分类,同时对引入的回应消息设计了可度量计算方法。另外,

4、又提出了回应消息可信度的概念,主要用来衡量回应消息的真实性。第三,本文从机器学习角度提出了基于语义特征和回应消息的微博情感分类方法。该方法通过提取微博语义特征、微博元素特征及回应消息特征,利用向量空间模型表示分类特征向量,结合SVM分类算法实现分类模型,实现对中文微博的情感分类。最后,本文使用新浪微博作为训练和测试数据,针对提出的方法设计了多组实验,详细对比分析了各组实验结果。得出的结论是本文提出的分类方法是可行和有效的。关键词:情感分类,微博,回应消息,回应消息可信度,SVMI......杭州电子科技大学硕士学位论文ABSTRACTWiththerapiddevel

5、opmentofthetechnologiesofWeb2.0,themicro-blogbecomesthemostpopularsocialapplicationafterblog.Themicro-blogisveryconvenienceandfree,alotofpeopleareattractedbyitinshorttimeandwritealotofmessagesintheplatformofmicro-blogeveryday.Thesemessagesareallwrittenbythepeoplethemselves,sothemessages

6、areveryrichintheemotionalcontent.Theycanbeminedinordertoknowtheattitudestothehotissuesandthegovernment'spolicies,asaresultwecanofferthedecisionsupportstotheusers,governmentsandcompanies.ThepaperusestheSinamicro-blogastheresearchobject,andthenthefollowingjobsaredoneinordertoproposeasenti

7、mentclassificationmethodtotheChinesemicro-blog.Firstly,wecollectsomemicro-blogmessagesfromSina,thenthecontentlength,thenumberofsentences,thelinks,thelabels,theemoticonsandthepicturesinthemessagesareanalyzedfromthestatisticalperspective.Analysisandcomparisonofthesecontentsisimpo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。