基于深度学习的文本情感分类研究

基于深度学习的文本情感分类研究

ID:37062627

大小:5.48 MB

页数:93页

时间:2019-05-17

基于深度学习的文本情感分类研究_第1页
基于深度学习的文本情感分类研究_第2页
基于深度学习的文本情感分类研究_第3页
基于深度学习的文本情感分类研究_第4页
基于深度学习的文本情感分类研究_第5页
资源描述:

《基于深度学习的文本情感分类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、SouthChinaUniversitofTechnoloygy硕士学位论文基于深度学习的文本情感分类研究作者姓名学科专业计算机科学与技术指导教师董敏副教授所在学院计算机科学与工程学院论文提交日期2018年4月1?J_|TheResearchofTextSentimentClassificationBasedonDeepLearningADissertationSubmittedfortheDegreeofMasterCandidate:TangXueSupervisor:Prof.DongMinSouthC

2、hinaUniversityofTechnologyGuangzhou,China分类号:TP39学校代号:10561学号:201520130707华南理工大学硕士学位论文基于深度学习的文本情感分类研究作者姓名:汤雪指导教师姓名、职称:董敏副教授申请学位级别:工学硕士学科专业名称:计算机科学与技术研究方向:自然语言处理论文提交日期:2018年4月20日论文答辩日期:2018年5月31日学位授予单位:华南理工大学学位授予日期:年月日答辩委员会成员:主席:高英教授委员:李桂清教授,陈伟能教授,毕盛副教授,苏锦钿副教授羊南理工大学学位振又原创性声明本人郑重声明:所呈交

3、的论文是本人在导师的指导下独立进行研宄所取得的研宄成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体:均已在文中以明确方式标明。本人完全意识到本声明的法律后果I由本人承担。,:日期作者签名摘:这年6月.4日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定::即研宄生在校攻读学位期间论文工作的知识产权单位属华南理工大学。学校有权保存并向国家有关部门或机构送交论文的复印件和电子版,允许学位论文被查阅(除在保密期内的保密论文

4、外);学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位一。致论文本人电子文档的内容和纸质论文的内容相。本学位论文属于:□保密,(校保密委员会审定为涉密学位时间:)_年_月日___于年月日解密后适用本授权书。_____0不保密,同意在校园网上发布d共校内师生和与学校有共享协议的单位浏览;同意将本人学位论文提交中国学术期刊(光盘版)电子杂志社全文出版和编入CNKI《中国知识资源“总库”》,传播学位论文的全部或部分内容。(请在以上相应方框内打V)w作者签名:日期:kf、指导教师签名:日期M

5、m^I联作者联系电话:电子邮箱:系地址(含邮编):摘要随着互联网的普及,人们喜欢在互联网上主动分享自己的观点意见和情绪感受,其中大部分情感内容都以文本为形式。对这些文本进行情感分析,有利于政府控制舆情、企业精准营销和消费者了解产品。因此,对常见的文本内容:微博和用户评论进行情感分类,是一个很有研究意义的课题。本文分别针对基于词向量和改进损失函数的情感分类、基于卷积神经网络和注意力机制的情感分类、基于特征融合和模型融合的情感分类这三个方面进行研究。(1)基于词向量和改进损失函数的情感分类。针对现有词向量在情感语义相似度表现不太理想的问题,本文使用包含较多

6、情感色彩的用户评论语料训练词向量,实验表明,获得的词向量对情感分类效果有明显的提升。针对常用的交叉熵损失函数不考虑预测错误的概率和类别,导致对“较容易分错”和不平衡的样本不敏感的问题,本文提出一种新的损失函数,同时考虑预测错误和正确的概率对损失的影响,并引入类别权重,提高不平衡数据的分类效果。(2)基于卷积神经网络和注意力机制的情感分类。针对Kim[2]提出的TextCNN(ConvolutionNeuralNetwork)只在句子长度方向上进行一维卷积,缺少词嵌入维度上的卷积,和池化层只有最大池化,可能丢失重要信息的不足,本文提出四种改进网络结构,在卷积层加入词嵌入维

7、度上的四种卷积,在池化层加入平均池化,提取更充分的特征。本文借鉴Vaswani[2]等人提出的Transformer只使用注意力构建机器翻译模型的思想,考虑以单层多头注意力机制作为情感分类模型,针对一般的注意力机制效果不好的问题,本文提出三种改进的点积注意力机制结构,加入残差连接、非线性函数,提高注意力机制的分类效果。实验验证了,本文提出的两种改进模型对分类准确率均有较好的提高。(3)基于特征融合和模型融合的情感分类。针对深层特征的融合效果不好的问题,本文提出使用双向LSTM(LongShort-TermMemory)和注意力机制的并行结

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。