电商平台购物虚假评论识别研究

电商平台购物虚假评论识别研究

ID:17826797

大小:1.82 MB

页数:64页

时间:2018-09-06

电商平台购物虚假评论识别研究_第1页
电商平台购物虚假评论识别研究_第2页
电商平台购物虚假评论识别研究_第3页
电商平台购物虚假评论识别研究_第4页
电商平台购物虚假评论识别研究_第5页
资源描述:

《电商平台购物虚假评论识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、电商平台购物虚假评论识别研究培养单位:统计学院专业名称:应用统计作者姓名:王禹指导教师:阮敬教授StudyonFalseCommentsandIdentificationofE-commercePlatformShoppingADissertationSubmittedforProfessionalDegreeofstatisticsCandidate:WangYuSupervisor:Prof.RuanJingCapitalUniversityofEconomicsandBusiness,Beijing,China摘要随着互联网的发

2、展与广大消费者对消费途径多样化的需求,电商平台发展迅速,网购也越发成为消费者进行购买活动的一个主流途径。消费者通过商品描述、价格,更主要的是通过商品评论信息来考察商品的质量及其他信息。一些商家为了吸引顾客,增加顾客的浏览、关注与购买,有偿雇佣一批网络刷单手,让他们在未收到和使用实际商品的情况下杜撰一些良好的评论以促使消费者对产品好感度提升,从而购买商品。这无疑会影响到消费者的决定,损害消费者的权益。因此,虚假评论的准确识别是一项重要且迫切的工作。本文的目的是给出一套对虚假评论进行精准、有效识别的方法及流程,并考察虚假评论的模式。主要采

3、用数据挖掘方法实现虚假评论的识别工作,主要工作包括:获取不同电商平台的样本商品数据,对文本进行量化,通过评论时间、重复评论、评论者等级等信息进行虚假评论预识别;并采用Logistic回归、k最近邻模型、SVM模型、text-CNN模型、fastText模型以及组合模型对虚假评论进行准确识别并进行验证;然后通过大量数据,考察虚假评论模式,构建虚假评论的语言模型,并从多维特征上考察虚假评论的行为属性以挖掘虚假评论在行为属性上的模式。本文创新点主要包含:1、通过数据多维特征如:重复评论、评论时间分布信息等对虚假评论进行预识别,结合预识别结果

4、进行人工标注和后续分析;2、对传统模型算法进行了调整,另外,通过模型的分类效果对模型赋予权重,进行模型集成,提升虚假评论识别的效果;3、除此以外,本文还通过虚假评论识别结果对虚假评论信息建立语言模型,分析虚假评论的多维特征以考察虚假评论在行为属性上的模式。关键词:虚假评论;fastText;text-CNN;组合模型;语言模型IAbstractWiththedevelopmentoftheInternetandtheconsumerdemandfordiversificationofconsumerchannels,thee-comm

5、erceplatformhasdevelopedrapidlyandonlineshoppinghasincreasinglybecomeamainstreamwayforconsumerstopurchase.Consumersusecommoditydescriptionsandpricestoexamineproductqualityandotherinformationthroughproductreviewinformation.Somemerchantsinordertoattractcustomers,increasec

6、ustomer'sbrowsing,attentionandpurchase,paidtohireagroupofnetworktobrushonehand,sothattheycancreatesomegoodreviewswithoutpromotingandusingtheactualgoodsinordertopromoteconsumerfavorabilityoftheproductPromotetobuygoods.Thiswillundoubtedlyaffecttheconsumer’sdecisionandharm

7、consumers’rightsandinterests.Therefore,theaccurateidentificationoffalsecommentsisanimportantandurgenttask.Thepurposeofthispaperistogiveasetofmethodsandprocessesforaccuratelyidentifyingfalsecomments,andtoinvestigatethemodeoffalsecomments.Thedataminingmethodisusedtoidenti

8、fyfalsecomments.Themaintasksinclude:acquiringsampleproductdatafromdifferente-commerceplatforms,quantifyingthet

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。