一种基于Web挖掘的智能导购系统

一种基于Web挖掘的智能导购系统

ID:38124324

大小:302.10 KB

页数:4页

时间:2019-05-27

一种基于Web挖掘的智能导购系统_第1页
一种基于Web挖掘的智能导购系统_第2页
一种基于Web挖掘的智能导购系统_第3页
一种基于Web挖掘的智能导购系统_第4页
资源描述:

《一种基于Web挖掘的智能导购系统》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、一种基于Web挖掘的智能导购系统AnInte¨igentShOppingSystemBasedOnWebMining曾子明(武汉大学信息管理学院武汉430072)*摘要针对消费者经常购买的商品.提出了一种基于Web挖掘技术的导购系统。系统综舍利用Web使用挖掘、关联规则挖掘等各种数据挖掘技术,能够实时跟踪消费者的购物行为,对其最近的偏好进行自适应学习,从而为消费者产生相应的推荐商品。最后,对系统的孚购质量进行了相关的实验。关键词web挖掘导购系统电子商务点击流中图分类号TP311近年来,Intemet和w

2、eb技术的发展促进了电子商务的发展。通过Int饥坨t网络,不同消费者和商家之问能够容易进行交互,同时必须保证交易双方在规定时间内完成商务交易。Forr酋ter公司、国际数据公司(InterllatioTlalDataC0rp.)和Nieben媒体研究机构的报告表明:在电子网站上进行购买、销售和执行电子交易的人数正在显著增长【l】。但是,随着电子商务规模的进一步扩大,消费者面对海量的商品信息要傲到货比三家,择优购买,并不是一件轻松之事。在消费者的整个购物阶段中,消费者需要花费越来越多的时间来浏览各种商务网站

3、,亲自对商品信息进行采集,并对所有商品进行比较,最后进行电子交易。这个过程是非常耗时的,有时浏览的网页文档内容与所需商品信息毫不相关,这势必影响消费者网上购物的信心。为了对消费者购物活动提供决策支持,解决以上问题的方法就是开发智能导购系统,以提供个性化的信息服务。导购系统是解决Internet网上购物中信息过载的一种有效机制,在一个导购站点,消费者可以寻找感兴趣的商品,由导购站点为其在网上进行自动搜索,消费者可以轻松地选择到合适的商品。因此,智能导购系统的主要目标是帮助消费者在I砒ernet海量信息环境下

4、进行商品检索和比较。它的具体任务是替消费者遍历海量商品信息,从中筛选出符合消费者购买倾向的信息,并基于购买历史主动获取消费者的偏好【2】。本文针对消费者网上经常购买的商品,提出一种基于web挖掘的导购系统,它综合利用web使用挖掘、商品关联规则等各种Web数据挖掘技术。1Web挖掘技术简介1.1Web使用挖掘web使用挖掘是基于web数据,应用数据挖掘技术进行消费者行为模式发现的过程。在电子商务的发展中,web使用挖掘的重要性越来越大,从web数据中提取的使用模式得到了广泛的应用。例如web个性化,系统性

5、能优化,网站更新,商业智能发现等。一般来说,Web使用挖掘整个过程被划分为两种主要任务,即数据收集和模式发现。数据收集任务建立一个服务器会话文件,其中每个会话文件代表单个消费者访问某个网站的一序列不同类型的请求。模式发现任务包括关联规则发现、序列模式发现、使用聚类分析、消费者分类方法以及其它模式发现方法【3】。目前已有几种面向电子商务的消费者行为模型,分别用于不同的分析目的。其中最典型的是k等人提出的关于在线零售商店的点击流分析【.】。点击流是用于web挖掘的有效低级数据,它对理解消费者购物行为模式提供了

6、必要的信息,例如消费者浏览了哪些商品,将哪些商品放到了购物车上,以及实际购买了哪些商品。通过Web使用挖掘方法对这些点击流数据进行分析,和单纯的分析消费者购买记录相比,能够更精确地分析消费者的偏好。1,2关联规则挖掘关联规则挖掘技术可以发现不同商品在消费者购买过程中的相关性。给定一组事务集合,其中每个事务是一个项目集;一个关联规则是形如X辛y的蕴涵式,X和l,表示项目集,且Xny=币,X和y分别称为关联规则x辛y的前提和结论。规则x辛y的支持度(sup阿)是事务集中包含X和y的事务数与所有事务数之比,记为

7、sup—pon(X净y);规则X辛Y的置信度(Confidence)是指包含X和y的事务数与包含X的事务数之比,记为con蹦ence(X辛y)。支持度用于衡量所发现规则的统计重要性,而置信度用于衡量关联规则的可信程度。一般来说,只有基金项目:教育部人文社会科学重点研究基地重大项目。电子商务中的商务信息跨平台检索与重组研究”《编号:07JJD870220)的研究成果。作者简介:曾子明,男,1977年生,博士,讲师,研究方向为电子商务、数据挖掘、信息检索等。田支持度和置信度均高的关联规则才可能是消费者感兴趣的

8、、有用的规则【5】。目前,Apriori算法是最流行的关联规则算法M】。该算法是一个基于两阶段频集思想的方法,即可以把关联规则挖掘划分为两个子问题:a.找到所有支持度大于最小支持度的项集,这些项集称为频集(FrequentItemset).b.根据频集和最小置信度产生关联规则。2导购系统设计2.1导购过程本导购系统的主要任务是:通过Web挖掘方法获取消费者最近的偏好,为其网上购物提供决策支持。图l给出个性化的系统导购过程。,,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。