中文旅游评论的情感分析研究

中文旅游评论的情感分析研究

ID:35039298

大小:6.77 MB

页数:69页

时间:2019-03-16

中文旅游评论的情感分析研究_第1页
中文旅游评论的情感分析研究_第2页
中文旅游评论的情感分析研究_第3页
中文旅游评论的情感分析研究_第4页
中文旅游评论的情感分析研究_第5页
资源描述:

《中文旅游评论的情感分析研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、m'密级:公开学校代码:10004i!NBEIJINGJIAOTONGUNIVERSITY"硕壬专业学位论文mgj巾魏鱗能m備職WH工程领域计算机技术指导教师王伟副教授lH|j^|培养院系计算机与信息技术学院^HBSwm^^m如交道乂攀硕d:专业学位论文中文旅游评论的情感分析研究SentimentanalysisofChinesetravelreviews作者:裴蕴艺导师:王伟北京义通大学2016年6月学位论文版权使用授权书本学位论文作巧完全了解北巧义通大学巧关保留。、使用学位论文的规

2、定恃^授权北京交通大学可^将学位论文的全部或部分内容编入巧关数据库进巧检索,提供阅览服务,并采用彰印、缩印或扫描等复制手段保存、汇编W供查阅和借阅。同意学校向圃家有关部口或机构送交论文的复印件和磁盘。学校可W为巧在馆际合作关系的兄弟高校用户提供文献传递服务和交换服务。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:导师签名:>1f(6签字日期:必t月日;年^月7^签字日期年:巧代帖.1()()0!帘纯:公引北京交通大学硕击专业学位论文中文旅游评论的情感分析研究SentimentanalsisofChinesetr

3、avelreviewsy作者姓名:裴蕴艺学号:14125191导师姓名;王伟职称:副教授工程硕±专业领域:计算机技术学位级别:硕+北京交通大学2016年6月i致谢,我首先要向我的导师王伟老师表示深深的谢意在此论文完成之际。在两年的学习和研究X作中,王伟老师给予了我精也的指导,本文中的思想和算法收益于和老师的共同探讨。在攻读硕尘学位期间,他给我提供了宽松自由的科研环境,鼓励我培养严谨的研巧态度和科学的工作方法,我的科研能为在他的帮助下得到了很大的提高,也奠定了我顺利完成学位论文的坚实基础。王伟老师对于我的科工作和论文都提出了许

4、多的宝贵意见。研,在此表巧衷也的感谢在实验室工作及撰写论文期间,王星师兄、魏宗涛等同学对我论文中的算法研充工作给予了热情帮助,在此向他们表达我的感激之情。同时还要感谢专硕1402班的同学在学习和工作上对我的关也和帮助。非常感谢我的室友一,我们在起度过了两年的时光,她们给予了我许多帮助和鼓励,与她们的相处中我受到了许多有益的启发,她们是我的良师益友。感谢父母一直W来在生活和学习上的支持和鼓励,感谢他们辛苦的劳动、无微不至的关爱。感谢我的家人。要感谢的人太多。对曾经关也过我、帮助过我的老师、亲人、朋友和同学在、此表示最衷屯的感谢。谢谢你们!i北京交

5、地乂巧硕I;以业学位论文摘嬰摘要随若全球旅游业快速发展和人们生活水平的提高,旅游逐渐成为人们闲暇时间的生活方式。然而,每个游客都会面临旅行目的地景点或酒店的选择决策问题。闡内外一些知名的旅游网站上均包含丰富的旅游评论信息,为广大游客的选择决策提供重耍依据。对这些用户发布的反馈和评价进行情感分析研究,无论在理论分析和实际应用上都具有重要意义。目前国内旅游领域的情感分析研究不够深入,未能考虑到中文的复杂多样性和评论集的不平衡性。针对W上问题,本文携程网为语料源,面向中文旅游评论进行了情感分析研究。由于语料集呈现较大的不平衡性,为消除不平衡因素的。

6、影响,本文主要分为平衡集和不平衡集的情感分类研巧两部分一在平衡集的研巧中:,本文在特征提取层面提出了两种改进方法是基于旅游主题词+情感词序列的特征提取算法,二是基于中文句式的特征改进方法。在此基础上,本文构建了SVM分类模型,对W上两种方法的有效性进行了验证。实验结果表明,改进方法提取了旅游维度各属性的特征及情感意见词,降低了特征的维度;能够有效识别复杂评论中真正表达的情感。在不平衡集的研究中,本文采用过抽样算法合成负面样本,降低数据集的不平衡性。本文讨论了SMOTE和BSMOTE算法的局限性,比如忽略了孤立点的影响,采样倍率不合理导致分类性能下降。针对这

7、两个问题,本文提出了MSMOTE算法,MSMOTE,并与前两种算法的性能进行了对比分析。实验结果表明算法有效地提高了负面样本的分类性能。本文建立了适应旅游领域的情感分类模型,降低了数据不平衡性对情感分类的影响,并提商了未知评论的分类准确率,可W帮助游客迅速识别评论的情感倾向。,并为旅行目的地的满意度分析提供理论依据情感分拆兼巧取:SVM分类,不平獻,獅样算法iii4I北如欠迦人学顿;化学化论文

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。