中文短文本情感分类方法的研究与实现

中文短文本情感分类方法的研究与实现

ID:35039292

大小:3.91 MB

页数:71页

时间:2019-03-16

中文短文本情感分类方法的研究与实现_第1页
中文短文本情感分类方法的研究与实现_第2页
中文短文本情感分类方法的研究与实现_第3页
中文短文本情感分类方法的研究与实现_第4页
中文短文本情感分类方法的研究与实现_第5页
资源描述:

《中文短文本情感分类方法的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、H!iBHP中围分类号:TP391龍:公开^^!UDC;004.4码:100的fl^^p皆^ft為?^净HEBEIUNIV巨民SITYOFSCIENC巨ANDTECHNOLOGY"'‘',片.中文短文本情感分类方法的研究与实现论文作者:杨鹏飞指导教师:张冬委教授企业指导教师:了保忠髙级工程师申请学位类别:工程硕±学科、领域:计算机技术、所在单位:信息科学与工程学院答辩日期:2016年12月—'——-.^河北科技大学学位论文原创性声明本人郑重声明:所呈交的

2、学位论文,是本人在导师的指导下,姬立进行研究工作所取得的成果。对本文的研究做出重要贡献的个人和集体,均已在文中W明确方式标明。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品或成果。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名;指导教师签名:^"P日年八月2乂年/么月1口日《河北科技大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部口或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权河化科技大学可W将本学位论文的全部或

3、部分内容编入有关数据库进行检索,可1^采用影印、缩印或扫描等复制手段保存和汇编本学位论文。□保密,在_年解密后适用本授权书。本学位论文属于保密""。(请在上方框内打V)一学位论文作者签名指导教师签名;報巧屋年/心月]/t?日年f^^月以日ClassifiedIndex:TP391SecrecyRate:PublicizedUDC:004.4UniversityCode:10082HebeiUniversityofScienceandTechnologyDissertationfortheMasterDegreeResearchand

4、ImplementationofChineseShortTextSentimentClassificationMethodCandidate:YangPengfeiSupervisor:ProfZhangDongwenEnterpriseSupervisor:SeniorEngineerDingBaozhongAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerTechnologyEmployer:SchoolofInformationScience&EngineeringDateofOralExa

5、mination:December,2016摘要摘要随着当前的互联网产业飞速发展,各种网络应用如微博、电子商务、论坛、博客应运而生。伴随着这些应用而来的是海量的网络文本数据。这些数据中所蕴含的观点信息不仅对网络应用有丰富的价值,而且对用户来说也是很重要的。为了从海量文本数据中提取出有效的观点信息,情感分类这个研究领域应运而生。本文使用有监督的机器学习方法,对中文短文本进行情感分类方法进行了研究和实现。基于机器学习方法本文使用了三种开源的工具,分别用于训练词向量,挖掘词语之间的浅层语义;提取语句结构特征中的核心词位置;进行情感分类和情感极性预测。本文的主要研究内容如下:1

6、)为了更近一步的提高分类的准确性,利用word2vec这一词向量工具,将海量文本数据转化为高维度空间中的向量值,通过向量之间的余弦值,获取词语之间语义的相近程度。通过实验可以验证,这种方法可以很好地提取出近义相似特征,将近义相似特征扩充到情感特征词典后,为后续的情感特征提取提供支持。2)给出了基于句式结构的情感分类方法。通过分析网络文本中的的正负情感语句,可以发现语句都是有一定结构特征的。在句式结构一定的情况下,配合相应的情感词,就可以确定短文本的情感类型。本文使用情感特征词库以及特定的句式结构词作为情感特征,将情感特征输入到libsvm做分类。通过实验可以验证,这种方

7、法有着很好的分类效果。3)基于语义的情感分类,本文使用两种方式来进行。一种是进行回归预测,也就是进行情感极性值预测。另一种是进行情感二分类,在进行分类之前使用PCA方法对情感特征进行了降维处理。通过实验可发现,本文基于语义方法的情感分类有着很好的效果。4)利用基于语义情感分类方法,对微博语料进行情感分类,将分析结果应用到舆情分析领域,开发实现了微博舆情分析系统。关键词情感极性预测;情感分类;word2vec;CRFs;Libsvm;特征降维;句式结构特征IAbstractAbstractWiththefast-growingdevelop

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。