基于web文本挖掘的企业口碑情感分类模型研究

基于web文本挖掘的企业口碑情感分类模型研究

ID:34666664

大小:7.38 MB

页数:78页

时间:2019-03-08

基于web文本挖掘的企业口碑情感分类模型研究_第1页
基于web文本挖掘的企业口碑情感分类模型研究_第2页
基于web文本挖掘的企业口碑情感分类模型研究_第3页
基于web文本挖掘的企业口碑情感分类模型研究_第4页
基于web文本挖掘的企业口碑情感分类模型研究_第5页
资源描述:

《基于web文本挖掘的企业口碑情感分类模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、.国一MASTE⋯R'STHE粥硕士学位论文基于Web文本挖掘的企业口碑情感分类模型研究论文作者:孙莹指导教师:张大斌教授学科专业:管理科学与工程研究方向:信息系统与项目管理华中师范大学信息管理学院2013年5月ResearchonEnterpriseReputafonEmotionClassificationModelBasedonWebTextMiningAThesisSubmittedinPartialFulfillmentoftheRequirementFortheM.A.DegreeinEngineeringByYingSunPostgraduat

2、eProgramDepartmentofInformationManagementCentralChinaNormalUniversitySupervisor:DabinZhangAcademicTitle:ProfessorSignatureApprovedMay,2013硕士学位论丈MASTERjSTHESIS华中师范大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作所取得的研究成果。除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的

3、个人和集体,均已在文中以明确方式标明。本声明的法律结果由本人承担。作者签名:焉、】\兰∑日期:≯影年3’月夥日学位论文版权使用授权书学位论文作者完全了解华中师范大学有关保留、使用学位论文的规定,即:研究生在校攻读学位期问论文工作的知识产权单位属华中师范大学。学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。(保密的学位论文在解密后遵守此规定)保密论文注释:本学位论文属于保密,在——年解密后适用本授权书。非保密论文注释:本学位论文不

4、属于保密范围,适用本授权书一/八’作者签名:羽、茁导师签名:彩≯良础髟\i日期:矽/乡年箩月力岁日日期:知17年f月1哆日本人已经认真阅读“CALIS高校学位论文全文数据库发布章程”,同意将本人的学位论文提交“CALLS高校学位论文全文数据库”中全文发布,并可按“章程”中的规定享受相关权益。回童途塞堡童卮溢卮!旦坐生i旦二生;旦三生筮查!作者签名:孙堇作者签名:彳小嗌日期:矽侈年y月砂日导师签名:日期:纱,令女,如月张∥硕士学位论文MASTER’STHESIS摘要随着互联网的发展,消费者越来越热衷于通过博客、点评网站等渠道分享关于各种品牌、产品以及服务的购买

5、心得,由此产生的网络口碑会直接影响其他消费者的购买决策。一方面,积极正面的口碑可以为企业吸引更多的客户,带来更大的利润;另一方面,过多的负面口碑会降低企业的信誉度,造成客户的流失。因此,对企业网络口碑进行情感分类,分析消费者的情感倾向,不仅有助于企业对负面口碑作出及时的反应,制定有效的应对策略;同时,通过对这些口碑文本细粒度的挖掘分析,还可以发现其中的商业价值,将其应用到产品个性化推荐,用户兴趣发掘等多个方面。本文以Web文本挖掘技术为基础,以情感分析技术为主线,研究了Web文本数据爬取,中文切词分词,停用词过滤等文本采集与预处理的关键技术;并在此基础上研究

6、了特征选择方法及其对情感分类的影响;然后基于情感词典构建了企业口碑倾向性计算模型,并用于酒店口碑情感分类的实证;接着利用K最邻近(Ⅺ州)算法构建情感分类器,实现细粒度的情感模型,最后同样针对酒店企业进行了细粒度的情感分类实证研究。本文的主要的研究工作包括:第一,研究了口碑网HTML页面的DOM树结构,利用RostDM软件设计了针对酒店评论的URL抓取规则和文本数据采集规则,采集了口碑网中两千多条,近十万字的酒店评论作为语料库。该语料库来自于消费者对酒店的主观评论,具有专业性,情感特征明显等优点,对研究Web文本的情感倾向问题具有一定的意义。第二,研究了特征选

7、择对情感分类的影响,在训练文本分类器的过程中,特征项的选择对分类器的效率和精度有显著的影响。本文采用KNN算法训练不同维度的特征集,得出对于情感文本的分类,用于训练的特征集并非越多越好。选取适量的特征集有助于提高后续研究的效率和准确度。第三,构建了基于情感词典的口碑倾向性计算模型,该模型通过改进原有的知网词典(HowNet),重新构建了情感词词典,添加了否定词词集以及程度副词词集,将不同强度的程度副词划分为五个等级,用于口碑文本的情感倾向性计算。并在该模型的基础上对前面采集到的近千条酒店口碑文本进行了情感分类。第四,研究了细粒度的情感分类模型,对消费者所关注

8、的酒店的房间、价格、位置、服务等属性进行了情感倾向性

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。