基于深度学习的中文评论观点抽取研究

基于深度学习的中文评论观点抽取研究

ID:17848646

大小:4.00 MB

页数:67页

时间:2018-09-07

基于深度学习的中文评论观点抽取研究_第1页
基于深度学习的中文评论观点抽取研究_第2页
基于深度学习的中文评论观点抽取研究_第3页
基于深度学习的中文评论观点抽取研究_第4页
基于深度学习的中文评论观点抽取研究_第5页
资源描述:

《基于深度学习的中文评论观点抽取研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、论文题目:基于深度学习的中文评论观点抽取研究学位类别:工程硕士学科专业:软件工程年级:2015研究生:张静指导教师:黄洪二零一八年五月国内图书分类号:TP311密级:公开国际图书分类号:004西南交通大学研究生学位论文基于深度学习的中文评论观点抽取研究年级2015姓名张静申请学位级别硕士专业软件工程指导老师黄洪二○一八年五月二十日ClassifiedIndex:TP311U.D.C:004SouthwestJiaotongUniversityMasterDegreeThesisResearchonChineseOp

2、inionExtractionbasedonDeepLearningGrade:2015Candidate:ZhangJingAcademicDegreeAppliedfor:MasterDegreeSpeciality:SoftwareEngineeringSupervisor:HuangHongMay.20,2018西南交通大学硕士研究生学位论文第I页摘要深度学习作为近年来国内外比较热门的机器学习模型,在自然语言处理领域表现出的优异性能受到众多研究者的关注。本课题将深度学习应用到中文评论观点抽取和中文评论情感分

3、类中,具有显著的研究意义和应用价值。基于中文评论观点研究中数据集较少且未公开的情况,本课题通过设计网络爬虫获取淘宝网站的真实用户评论数据,利用淘宝用户评论观点数据、搜狗新闻和百度百科数据作为语料训练词向量,并在人工标注的数据集进行模型的训练、验证和测试。本课题提出一种提出基于记忆网络的中文评论观点属性词抽取。该模型的最大贡献是将记忆网络融入到双向长短期记忆网络中,出发点是抽取历史句子中存在的评论观点模式存储并应用到未知评论句子上。该模型由双向长短期记忆网络模块、记忆网络模块和条件随机场模块组成。模型中,双向长短期记

4、忆网络模块作为一个特征提取器模块,用于提取评论语句的句子特征;记忆网络模块作为一个存储器,用来存储双向长短期记忆网络模型提取出的句子模式;条件随机场在给定句子特征及句子模式特征的条件下,计算整个标记序列的联合概率。最后句子的所有评论观点将通过Viterbi算法得到。与其它7个基准组合模型的对比实验表明了所提抽取模型的有效性。以上述基于记忆网络的中文评论观点属性词抽取为基础,本课题将其延伸到中文评论情感分类任务上,提出了基于记忆网络的深度学习中文评论句子级情感分类模型。该模型将抽取模型的标注层替换为分类层,在与2个基

5、准组合模型的对比实验中,表明了所提分类模型的有效性。关键词:深度学习;记忆网络;观点抽取;情感分类西南交通大学硕士研究生学位论文第II页AbstractAsapopularmachinelearningmodel,deeplearninghasbeenpaidmoreattentionbymanyresearchersinthefieldofNaturalLanguageProcessinginrecentyears.Thispaperaimsatapplyingdeeplearninginopinionextra

6、ctionofChinesecommentaryandsentimentclassification,andithasanimportantresearchsignificanceandapplicationvalue.IncaseoffewandundiscloseddatasetsinthestudyofChinesecomments,weobtainthecommentsdatafromTaobaoviathewebcrawler.Then,wewilltrainwordvectorbyusingtheTao

7、baocommentsdata,SogounewsdataandBaiduWikipediadataseparately.Themanuallytaggeddatasetswillbeusedtotrain,verifyandtestthemodel.WeproposedadeeplearningmodelofChineseaspecttermextractionbasedonmemorynetwork(Me-BiLSTM).Thecontributionofthismodelistheintegrationofm

8、emorynetworkandbidirectionlongshort-termmemory.Thepurposeofthemodelistoextractthesentencepatternsfromthehistoricalsentencesandapplythemtotheunknowncommentsentences.Themodelconsists

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。