超市数据仓库与数据挖掘的应用

超市数据仓库与数据挖掘的应用

ID:34610008

大小:200.79 KB

页数:4页

时间:2019-03-08

超市数据仓库与数据挖掘的应用_第1页
超市数据仓库与数据挖掘的应用_第2页
超市数据仓库与数据挖掘的应用_第3页
超市数据仓库与数据挖掘的应用_第4页
资源描述:

《超市数据仓库与数据挖掘的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、万方数据第35卷(2007)第9期计算机与数字工程超市数据仓库与数据挖掘的研究‘汪立军(南通农业职业技术学院计算机系南通226007)摘要传统的数据库管理信息系统不能够很好地利用、分析数据库中积累的大量数据,数据仓库与数据挖掘技术很好地解决了这一问题。通过分析超市业务数据库,用星型架构的方式建模,构造出一个数据仓库的逻辑模型;然后从超市业务数据库中抽取数据,经过转换等处理,把有价值的数据加载到数据仓库中,完成数据仓库的构建,并论述客户分片的数据挖掘过程。关键词数据仓库数据挖掘ETL中图分类号TP3931引言在经营中,了解客户是成功的关键。随着商品和服务

2、的多样化,对客户的了解就显得更为重要,其难度也愈来愈大。客户在做些什么?对商家推出的优惠措施有什么样的反应?商家应该如何提供新的产品和服务?这些都是每个商家必须面对的问题。每个客户都希望享有“一对一”的个性化服务,但事实上这种希望是几乎不可能实现的。解决这些问题的一种可行的方法是,通过分析客户购买商品的行为,利用数据挖掘技术将这些客户分成不同的类别,这个过程称之为客户分片(cu咖mersegIIlentation)。客户购买商品的行为可能是:购物时间是集中性购买,还是分散性购买?所购产品是趋向于物美,还是偏好价廉?选择产品的类型是多样,还是单一等。针对

3、不同类型的客户,商家推出不同的策略,以迎合不同客户的购物习惯,这样,所推出的策略就更具有针对性,而客户也感到了更多的人文关怀。针对以上提出的问题,以某个超市的应用数据库为基础,该数据库中存储了大量的客户基本信息、客户购买产品的交易数据、产品信息等数据,讨论如何构建该超市的数据仓库,并论述客户分片的数据挖掘过程。2超市数据仓库2.1超市数据仓库的维表分析超市源数据库,用星型架构的思想建模可得到超市的数据仓库的维表,这些维表分别是:客户维(dim—eustomer),产品促销维(dim—prom0一Ⅱon),分类维(dim—cate90ry),货币维(di

4、m—cu玎en-cy),商店维(dim一咖re),时间维(dim一“me),仓库维(dim_warehouse),产品维(dim—pmduct),产品分类维(dim_producLcla8B),账户维(dim—accoum)等维表。该数据仓库的事实表,有:销售(sales—fact),存货(inventory—fact),开支预算(e1Pense-』jct)。2.2超市数据仓库的ETL执行ETL过程时,第一次处理采用“完全处理”方式,以后的ETL过程对慢速变化维表类型2采用“增量更新”的方式。它们的不同之处主要体现在数据的抽取方面,前者是抽取所有“有效

5、”数据,后者是利用源数据库中表的时间戳,抽取菜一时间段的数据。抽取出来的数据经过适当的转换,加载到数据库中。第一次从cus£onler表抽取数据的sql语句如下:SEU£CTcu8tomedd鹕Cu8t删1erNO.acc叫nt—nl皿,ln“rne,fname,min姗e,8h℃et,cityrP而nce,country,pos卜d—code,phone,birtIldate,m日rit丑l—Btatu8,ye曲一income,g朗der,t0“一children,daIe—accnt一0P朗ed,educati∞,mem-ber_c日rd,0cc“

6、P且tionFROMcuetomeL在以后的抽取中,要考虑到时间段,还有“重要值”(自然键值)是否已改变等因素,例如对于客户维表来说,该客户所处的区域是“重要值”,当区域发生变化后,要抽取出有变化的记录。本次抽取数据的sql语句如下:SELECTcuitoⅢe耐舯C岫tomerN0.玉。叩nt—n哪,·收到本文时间:2006年11月21日作者简介:汪立军,男。讲师,硕士研究生。研究方向:软件工程。万方数据80汪立军:超市数据仓库与数据挖掘的研究第35卷lname,fname,min哪e,stre毗,city,p。ovince,c叫ntry,post_日

7、l—code,phone,binhdate,marital一st且tus,yeady—incor肿,gender,t刊一child唧,date一且ccⅡt一叩ened,educati帆,rnem_kr_caId,0ccupa60nFR()MⅢtom日.S0urceCLE兀_0UTERJoINdim_customerTargetc0NsourceC.cuBtomedd=Ta。8etC.cu目tomerN0wHERE(S0urceC.i啊毗一dtmbetw∞n($MillDtm,$Maxnm、ORS0uH托.1lpdated缸nbemeen($胁『lDtI

8、Ⅱ,$M丑xD【m))AND((sourcec.s啦et<>Targetc.shd)OR(so

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。