电子商务中Web数据挖掘的应用研究.doc

电子商务中Web数据挖掘的应用研究.doc

ID:11546009

大小:26.00 KB

页数:3页

时间:2018-07-12

电子商务中Web数据挖掘的应用研究.doc_第1页
电子商务中Web数据挖掘的应用研究.doc_第2页
电子商务中Web数据挖掘的应用研究.doc_第3页
资源描述:

《电子商务中Web数据挖掘的应用研究.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、电子商务中Web数据挖掘的应用研究[摘要]本文介绍了Web数据挖掘的概念及其分类,探讨了电子商务中Web数据挖掘的过程,重点研究了Web数据挖掘方法,从而有效提高电子商务企业的竞争力。  [关键词]电子商务数据挖掘Web挖掘    Internet是一个巨大、分布广泛、全球性的信息资源储备库。随着上网人数的急剧增加,电子商务的蓬勃发展,各种基于互联网的商业Web站点也面临越来越激烈的竞争。Web包含了丰富和动态的超链接信息,以及Web页面的访问和使用信息,这为数据挖掘提供了大量丰富的资源。    一、电子商务与Web数据挖掘    电子商务(E-Commerce

2、)是以网络为平台,以现代信息技术为手段,以经济效益为中心的现代化商业运转模式,其最终目标是实现商务活动的网络化、自动化与智能化。无论EC企业采用B2B、B2C还是B2G电子商务模式,商品的采购者都需要通过Web方式与商品的供应商及其合作者之间建立信息流的交互,那么,一方面通过Web方式与购买者主动、方便、快捷的获得期望主题的信息;另一方面供应商与合作伙伴们如何通过他们的集成信息系统,运用知识把访问者、网上购买者的访问数据从潜在的、隐含的、事先不知的状态,经过提取、洗涤、加工变为潜力巨大的价值信息,从而提高企业的核心竞争力。  Web数据挖掘(WebDataMin

3、ing)是利用数据挖掘从Web文档及Web服务中自动发现并提取用户感兴趣的、潜在的、有用的模式和隐藏信息。Web数据挖掘的主要目标就是从Web的访问记录中抽取用户感兴趣的模式,WWW服务器中的访问日志,记录了关于用户访问和交互的信息,通过Web数据挖掘,就可以根据用户的访问兴趣、访问频度、访问时间动态地调整页面结构,改进服务,开展有针对性的电子商务活动,以更好地满足客户的需求。    二、Web挖掘的分类    Web挖掘是从WWW上抽取知识的过程。它是从与WWW相关的资源和行为中抽取感兴趣的有用的模式和隐含信息。    1.Web内容挖掘  Web内容挖掘是对

4、Web页面内容进行挖掘,是从大量的Web数据中发现信息、抽取知识的过程。Web挖掘的数据源有:服务器数据、查询数据、在线市场数据、Web页面、Web页面的超级链接关系、客户登记信息等。    2.Web结构挖掘3  Web结构挖掘是从WWW上的组织结构和链接关系中推导知识。由于超文本文档间的关联关系使得WWW不仅仅可以揭示文档中所包含的信息,同时也可以揭示文档间的关联关系所代表的信息。利用这些信息可以对页面进行排序,发现重要的页面。挖掘Web结构的目的是发现页面的结构和Web结构,在此基础上对页面进行分类和聚类,从而找到权威页面。  3.Web使用记录挖掘  W

5、eb使用记录挖掘的主要目标是从Web的访问记录中抽取感兴趣的模式。WWW中的每个服务器都保留了访问日志(Webaccesslog),记录了关于用户访问和交互的信息。分析这些数据可以帮助理解用户的行为,从而改进站点的结构,或为用户提供个性化的服务。    三、Web挖掘的过程和方法    1.Web挖掘的过程  电子商务中的Web挖掘过程一般由3个主要阶段组成:数据准备、挖掘操作、结果表达和解释。  (1)数据准备:这个阶段又可分成3个子步骤:数据集成、数据选择、数据预处理。数据集成将多文件或多数据库运行环境中的数据进行合并处理,解决语义模糊准备,这个阶段又可分成

6、为处理数据中的遗漏等。数据选择的目的是辨别出需要分析的数据集合,缩小处理范围,提高数据挖掘的质量。预处理是为了克服数据挖掘工具的局限性。  (2)数据挖掘:这个阶段进行实际的挖掘操作,包括的要点有:决定如何产生假设;选择合适的工具;发掘知识的操作;证实发现的知识。  (3)结果表述和解释:根据最终用户的决策目的对提取的信息进行分析,把最有价值的信息区分开来,并且通过决策支持工具提交给决策者。因此,这一步骤的任务不仅是把结果表达出来,还要对信息进行过滤处理,如果不能令决策者满意,需要重复上述过程。    2.Web数据挖掘的方法  (1)协同过滤:协同过滤技术采用

7、最近邻技术,利用客户的历史、喜好信息计算用户之间的距离,目标客户对特点商品的喜好程度由最近邻居对商品的评价的加权平均值来计算。  (2)关联规则:关联规则是寻找在同一个事件中出现的不同项的相关性,用数学模型来描述关联规则发现的问题:x=>y的蕴含式,其中x,y为属性——值对集(或称为项目集),且X∩Y空集。在数据库中若S%的包含属性——值对集X的事务也包含属性——值集Y,则关联规则X=>Y的置信度为C%。  (3)Web日志的聚类算法:聚类分析是把具有相似特征的用户或数据项归类,在网站管理中通过聚类具有相似浏览行为的用户。基于模糊理论的Web页面聚类

8、算法与客户群体聚类算法的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。