web数据挖掘技术及其在电子商务中的应用论文

web数据挖掘技术及其在电子商务中的应用论文

ID:24842910

大小:50.00 KB

页数:4页

时间:2018-11-16

web数据挖掘技术及其在电子商务中的应用论文_第1页
web数据挖掘技术及其在电子商务中的应用论文_第2页
web数据挖掘技术及其在电子商务中的应用论文_第3页
web数据挖掘技术及其在电子商务中的应用论文_第4页
资源描述:

《web数据挖掘技术及其在电子商务中的应用论文》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、Web数据挖掘技术及其在电子商务中的应用论文摘要Inter应用的普及使得数据挖掘技术的重点已经从传统的基于数据库的应用转移到了基于ining,DM)技术的迅速发展及数据库管理技术的广泛应用,人们积累的数据越来越多。如何从浩如烟海的数据中找到内在的规律,如何更方便地传递、交流、获取有用的信息,挖掘这些激增数据背后隐藏的重要信息已成为当前高科技领域研究的热点。经过长期对数据库的研究与开发,产生了数据挖掘技术,数据挖掘技术不仅能够对过去的数据进行查询和遍历,并且能够找出数据间的潜在联系,从而促进信息的传递。他使数据库技术进入一个更高的

2、阶段。Web是一个巨大、广泛分布、高度异构、半结构化、超文本/超媒体、相互联系并且不断进化的信息仓库;也是一个巨大的文档累积的集合,包括超链接信息、访问及使用信息。传统的数据挖掘大多是针对关系数据库或数据仓库的,处理的数据具有完整的结构,但是Web包含各种类型的数据,现有的数据库管理系统无法操纵和管理大量的非结构化数据,其用户群体也表现出多样性的特点。Web数据挖掘起源于数据挖掘,目的在于可以处理非结构化的数据,Web数据的非结构化这一显著特征使Web数据挖掘更加复杂。二、电子商务电子商务(e-business,e-erce)是

3、一种利用现在先进的电子技术从事各种商业活动的方式;是一套完整的网络商务经营及管理信息系统;是一种利用现有的计算机硬件设备、软件和网络基础设施.freeler)的电子商务(即B2C)和企业对企业的电子商务(B2B)两种主要模式。卓越亚马逊是一家通过互联网售卖图书的网上书店。通过卓越的Web网站,用户在购书时可以享受到很大的便利,比如要在100万种书中查找一本书,用户可以通过检索功能,只需几分钟就会找到我们想要的书。三、Web挖掘技术与流程数据挖掘是通过挖掘数据仓库中存储的大量数据,从中发现有意义的新的关联模式和趋势的过程。从商业的

4、角度定义,数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。Web挖掘指使用数据挖掘技术在数据中发现潜在的、有用的模式或信息。Web挖掘研究覆盖了多个研究领域,包括数据库技术、信息获取技术、统计学、人工智能中的机器学习和神经网络等。Web挖掘可以在很多方面发挥作用,.freel),用于考察购书者的行为表现。网络底层信息监听过滤指监听整个网络的所有信息流量,并根据信息源主机、目标主机、服务协议端口等信息过滤掉不关心的垃圾数据,然后进行

5、进一步的处理,如关键字的搜索等,最终将购书者感兴趣的数据发送到给定的数据接受程序,存储到数据库中进行分析统计。其工作流程如图2所示:(3)后台数据库里的原有数据。后台数据库存储了购书者、图书和订单这三个方面信息,主要有3个数据表构成:第1个是User(用户信息数据表),他用来存放登录在卓越网的用户信息;第2个是Book(图书数据表),用来记录图书的基本信息;第3个是Orders(订单数据表),用来存放购买者在网上所下的订单情况。三个数据表的结构如图3所下:2.数据的预处理。按照Web数据挖掘技术,将后台数据库与网络日志预处理后得

6、到的数据相匹配建立数据挖掘库,即购书者特征数据仓库,将收集到的数据进行分门别类。依照此原理便可以将分布在不同功能模块中的信息抽取出来,然后清洗清数据。3.数据挖掘阶段。我们把以上信息转化为多维数据模型中的星型模式来表示如下:我们将用户的一次订书看作1个事务T,采集到的多个订书记录T组成事务数据库D,它由N个二维数组组成,数组的行集为所有BBS登录记录样本的集合,列集为特征集,事务的惟一标识符为SrcIP。Web数据挖掘技术实现的总体流程如下:(1)确立目标样本,即由用户选择目标文本,作为提取用户的特征信息。(2)提取特征信息,

7、即根据目标样本的词频分布,从统计词典中提取出挖掘目标的特征向量并计算出相应的权值。(3)网络信息获取,即先利用搜索引擎站点选择待采集站点,再利用Robot程序采集静态Web页面,最后获取被访问站点网络数据库中的动态信息,生成资源索引库。(4)信息特征匹配,即提取索引库中的源信息的特征向量,并与目标样本的特征向量进行匹配,将符合阈值条件的信息返回给用户。Web数据挖掘还有待进一步的研究,尤其是近来对Web内容挖掘方面集中在信息集成,如建立基于Web的知识库或基于Web的数据仓库的研究上,但这种访求同样存在很多的问题。但建立一个基于

8、Web数据仓库的数据挖掘系统仍是一种值得研究的方法。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。