数据挖掘在淘宝卖家评论中的应用.doc

数据挖掘在淘宝卖家评论中的应用.doc

ID:58854269

大小:208.00 KB

页数:6页

时间:2020-09-23

数据挖掘在淘宝卖家评论中的应用.doc_第1页
数据挖掘在淘宝卖家评论中的应用.doc_第2页
数据挖掘在淘宝卖家评论中的应用.doc_第3页
数据挖掘在淘宝卖家评论中的应用.doc_第4页
数据挖掘在淘宝卖家评论中的应用.doc_第5页
资源描述:

《数据挖掘在淘宝卖家评论中的应用.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、电子商务客户评论的有效性及其引导分析摘要:许多电子商务网站(如B2C商城淘宝网)为买家提供了对所购商品进行评论的平台,该平台为买家创造了了解商品、信息交流、接收反馈信息等的机会。同时,买家可以通过对这些评论的参考,充分利用其中的有效信息来引导自己对该商品的购买,同时也可以保障购买质量。然而,在大量的买家评论中,一定会存在一些重复冗余的信息。在当今电子商务高度发展的环境下,买家若是能够从这些大量评论中进行筛选,找出有效的评论从而引导自己更好地购买商品,这将大大保证购买的质量,同时也在无形中引导自己给该商品的交易做出恰当实际的评价。这篇文

2、章旨在以淘宝网为例子,分析其买家的评论,教大家如何辨别有效评论并引导潜在客户对该商品的购买。提出一种挖掘新颖信息的算法,并分析了算法的可行性以及有效性。关键词:电子商务淘宝网买家评论潜在客户有效信息0前言随着互联网商业化的迅速发展,电子商务网站大量涌现,市场竞争日趋激烈。网站经营者需要知道网站受用户欢迎的程度,用户们如何使用该网站,网站的成功与不足之处,并找到进一步改善的方法。网站投资者需要了解网站的运营状况、品牌实力和发展潜力等,评估网站的价值,以便作出投资决策。消费者需要了解如何寻找最好的网站,以获得最好的服务和最大的价值。解决这

3、些问题就必须采用合适的标尺和方法来评估网站。因此,电子商务网站评价的强烈社会需求促使网站评价的研究和实践活动蓬勃发展起来。本文拟对电子商务网站评价研究与应用进行分析,以利于进一步推动这一研究的深入开展和促进电子商务网站评价应用更健康地发展。电子商务网站评价是指根据一定的评价方法和评价内容与指标对电子商务网站运行状况和工作质量进行评估。作为电子商务市场发展和完善的重要推动力量,电子商务网站评价不仅使自身得到快速发展,并且通过评价活动促进电子商务网站的整体水平和质量的提高,监督和促进电子商务网站经营规范和完善,从而推动电子商务的健康发展。

4、电子商务网站评价能够在一定程度上解决商务网站和顾客之间的信息不对称问题。顾客可以根据中立的网站评价结果,获得可靠的各个商务网站的评价信息,从而降低信息搜寻成本,并且有助于更方便、更迅速地选择合适的网站进行商务活动或获得最好的服务。例如,在网上购物方面,消费者利用网站评分结果,就可以从产品的价格、质量,网上商店的特别优惠措施等各方面比较不同的网上商店,从而使消费者能够根据自己的需要找到最合适的网站,并能买到价廉物美的产品21世纪是电子商务高度发展的时代,作为亚太地区最大网络零售商的淘宝网,占据着中国80%以上的网购市场份额。因此,对淘宝

5、网的研究无论是从理论上还是现实上都具有重大意义。本文研究的出发点就是针对淘宝商品的大量买家评论数据。一般顾客在淘宝店铺购买商品之后,都会在评论平台上发表一下对所购商品的看法,而这些评论对潜在买家而言无疑是一笔财富。倘若买家能够从这些评论中迅速挖掘出真实可靠的有效信息,势必会对自己的购买行为产生极大帮助。新颖信息挖掘1.1挖掘模型新颖信息挖掘就是从文本中挖掘出读者所关心的、有用的、新颖的信息,该技术在冗余信息过滤领域有着广泛的应用[5]。新颖信息挖掘模型主要由三个部分组成,即预处理、分类和新颖信息挖掘(如图1所示)。当某一位买家的评论输

6、入到模型中后,首先借助机器学习方法进行预处理;预处理之后进入分类阶段,该阶段的主要任务就是借助事先给定的主题(或关键字)来过滤不相关的评论;最后进入新颖信息挖掘阶段,该阶段的任务就是通过和历史记录做对比,判断该条评论是否是新颖的。买家评论新颖评论相关评论DB新颖信息挖掘分类预处理(机器学习方法)历史记录给定主题(或关键字)图1新颖信息挖掘模型本文中,所有买家的评论将被人为地分为三类:质量、价格与物流供应。因此,我们所关注的是预处理与新颖信息挖掘这两个阶段。1.2挖掘算法文献[6]介绍了新颖信息挖掘算法的两种基本思想,即“一对一比较”与

7、“多对一比较”。本文是基于“一对一比较”这一思想,即通过当前评论记录与其之前每一条记录相比较,获得该条记录的新颖度,然后与预先给定的一个阈值相比较,若小于,则认为该条评论记录是冗余的,否则是新颖的。在写出挖掘算法步骤之前,先介绍几个基本概念。(设数据库中已存放CN条买家评论数据记录)新颖信息挖掘的算法步骤如下:(1)给定阈值与n个关键词;(2)浏览数据库中的第i条评论记录,由(1)式算出第j个关键词在i中的权重(i=1,2,…,CN,j=1,2,…,n);(3)由(2)式算出第i条记录与其之前的每一条记录的相似度(i=1,2,…,CN

8、);(4)由(3)式计算出第i条记录的新颖度(i=1,2,…,CN);(5)根据“一对一比较”这一思想,确定第i条记录是否冗余(i=1,2,…,CN).1.3算法的可行性和有效性分析文献[7]给出了用F值法来衡量新颖信息

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。