欢迎来到天天文库
浏览记录
ID:35181271
大小:6.40 MB
页数:84页
时间:2019-03-21
《基于依存句法的情感分析系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、工程硕士学位论文基于依存句法的情感分析系统的设计与实现作者姓名胡骋工程领域计算机技术校内指导教师高英教授校外指导教师徐国明高级工程师所在学院计算机科学与工程论文提交日期2016年4月29日TheDesignandRealizationoftheSentimentAnalysisSystemBasedontheDependencyGrammarADissertationSubmittedfortheDegreeofMasterCandidate:HuChengSupervisor:Prof.GaoYingSouthChinaUniversityofTechno
2、logyGuangzhou,ChinaI、分类号:TP3門学校代号:10561学号:201321030800■4华南理工大学硕±学位论文基于化存句法的情感分析系统的设计与实现'?I:作者姓名:胡聘指导教师姓名、职称高英教授:申请学位级别:工程硕±工程领域名称冲溝机拖论文形式:□产品研发□工程设计囚^用研究□工程/项目管理□调研报告研巧方向:软件技术开发论文提交曰期:么〇化年曰论文答辩曰期J口/6年^月Y曰'学位授予单位:华南理王大学学位授予日期:年月日答辩委员会成员:主席张!自肖
3、:怒喪、你奸約_扣■陈奔委员:华南理工大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体。本人完全意识到本声明的,均已在文中W明确方式标明法律后果由本人承担。文作者签名;日期:年斗月日^学位论文版权使用授权书艮本学位论文作者完全了解学校有关保留、使用学位论文的规定,P:研究生在校攻读学位期间论文工作的知识产权单位属华南理工大学。学校有权
4、保存并向国家有关部口或机构送交论文的复印件和电子版,允许学位论文被查密期)可W公布学位论文的全(内的保密论文外;学校阅除在保’手段保存、汇编学位,可制部或部分允许采用影印、缩印或其它复内容一。论文相致。本人电子文档的内容和纸质论文的内容本学位论文;属于。密,在年解密后适书用本授权上发布,供校生和与学校有共享协议保密园网内师,同意在校刊(光盘版志社单位浏览中国学术期)电子杂;同意将本人学位论文提交的CMQ识源总库》,传播学位论文的全部或部分全文《中国知资出版和编入。内容""请在^*上V^^相应方框内打)(日::期作
5、者签名喘嫂卡巧叫、:日期指导教师签名i4Zij叫子:邮箱作者联;电系电话联;系地址含邮编)(摘要随着互联网技术的快速发展,互联网作为信息传播的载体,已经成为无数网民获取信息以及发表个人主观意愿的主要渠道。通过结合计算机技术和自然语言处理技术对网民言论观点的识别与分析已经成为不少商业机构和相关部门的重点需求,一个能对互联网文本信息进行观点挖掘的情感分析系统呼之欲出。结合实际需求,本文所设计的基于依存句法的情感分析系统主要对网络上评论进行句子级情感分析。该系统首先对已经经过网络爬虫采集、正文提取、中文分词以及词性标注等工作流程的网络文本数
6、据,先进行话题的检测,然后对热点以及敏感话题进行识别,从而提高后续文本情感分析的效率。在进行情感分析之前,本文还在现有较权威的NTUSD以及HowNet情感词典的基础上进行扩充,并通过网络常用词以及常用错别字词典增强词典对词语匹配,从而构造系统所需的情感词库。本文进行情感分析时所采取的技术路线是:结合自然语言处理的知识,将依存句法、语义角色标注和命名实体识别三者结合,设计出了特征-情感词对提取算法以及修饰词列表提取算法,并通过情感极性值技术完成了对评论的情感倾向性分析。本文在真实的网络文本数据集上进行实验,验证了基于依存句法的情感分析方法的可行性。关键字:情
7、感分析;话题识别;依存语法;情感词库IAbstractWiththerapiddevelopmentofInternettechnology,asacarrierofinformation,theInternethasbecomethemainchanneltoobtaininformationandexpressownsubjectiveviewsofcountlessusers.Thetechnologywhichcombinescomputertechnologyandnaturallanguageprocessingtechnologyhasbeco
8、methemainrequirementsofsom
此文档下载收益归作者所有