数据仓库与数据挖掘第2章.ppt

数据仓库与数据挖掘第2章.ppt

ID:51743144

大小:1.03 MB

页数:55页

时间:2020-03-30

数据仓库与数据挖掘第2章.ppt_第1页
数据仓库与数据挖掘第2章.ppt_第2页
数据仓库与数据挖掘第2章.ppt_第3页
数据仓库与数据挖掘第2章.ppt_第4页
数据仓库与数据挖掘第2章.ppt_第5页
资源描述:

《数据仓库与数据挖掘第2章.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、一、多维数据模型二、数据仓库的系统结构三、数据仓库的实现四、基于数据仓库的数据挖掘第二章数据仓库的OLAP技术第一节多维数据模型1.数据立方体数据仓库和OLAP工具基于多维数据模型,多维数据模型将数据看作数据立方体(datacube)形式。数据立方体允许以多维对数据建模和观察,由维和事实定义第一节多维数据模型1.数据立方体维是关于一个组织想要记录的透视或实体每一个维都有一个表与之相关联,该表称为维表,它进一步描述维多维数据模型围绕中心主题组织,主题用事实表表示事实是数值的度量,事实表包括事实的名称或度量,以及每个相关维表的关键字第一节多维数据模型1.数据立方体设某BSE

2、K北星易家连锁公司由下列关系表描述:Customer(cust_id,name,address,age,…)Item(item_id,name,type,price,…)Employee(empl_id,name,salary,…)purchases(trans_id,cust_id,empl_id,date,time,method_paid,amount,…)Branch(branch_id,name,address)第一节多维数据模型1.数据立方体例如,BSEK可能创建一个数据仓库sales,记录商店的销售情况,涉及time,item和location。典型3-D立

3、方体如图:timelocationitem第一节多维数据模型2.多维数据库模式E-R数据模型适用于OLTP,而数据仓库需要简明的、面向主题的模式,便于联机数据分析。数据仓库的数据模型采用多维数据模型星型模式雪花模式事实星座模式第一节多维数据模型2.多维数据库模式星型模式:是最常见的模型范式。这种模式的数据仓库包含:一个大的事实表和一组小的维表事实表包含大批数据和不含冗余的中心表维表附属表,每维一个表第一节多维数据模型2.多维数据库模式星型模式time_keyitem_keybranch_keylocation_keymoney_soldunits_soldbranch_

4、keybranch_namebranch_typelocation_keystreetcitycountryitem_keyitem_namebranchtypetime_keydayWeekmonth…Sales事实表time维表branch维表location维表item维表第一节多维数据模型2.多维数据库模式雪花模式:是星型模式的变种,其中某些维表是规范化的,因而数据被进一步分解到附加的表中雪花模式的规范化维表,可以减少冗余,便于维护,并且节省存储空间;同巨大的事实表相比,空间节省有限执行查询需要更多连接操作,雪花模型可能降低浏览的性能第一节多维数据模型2.多维数

5、据库模式雪花模式time_keyitem_keybranch_keylocation_keymoney_soldunits_soldbranch_keybranch_namebranch_typelocation_keystreetcity_keyitem_keyitem_namebranchtype_keytime_keydayWeekmonth…type_keytype_namecity_keycitycountrySales事实表timebranchlocation维表item维表type维表city维表第一节多维数据模型2.多维数据库模式事实星座模式复杂的应用可

6、能需要多个事实表共享维表,这种模式可以视为星型模式集,因此称为星系模式,或事实星座模式第一节多维数据模型2.多维数据库模式事实星座模式time_keyitem_keybranch_keylocation_keymoney_soldunits_soldbranch_keybranch_namebranch_typelocation_keystreetcity_keyitem_keyitem_namebranchtype_keytime_keydayWeekmonth…item_keytime_keyfrom_locationshipper_keymoney_costuni

7、ts_shippedshipper_keyshipper_namelocation_keySales事实表timebranchlocation维表item维表shipping事实表shipper维表第一节多维数据模型3.度量的分类与计算数据立方体度量是一个数值函数,该函数可以对数据立方体的每一个点求值。通过对给定点的各维-值对聚集数据,计算该点的度量值度量根据所用的聚集函数分成三类:分布的度量、代数的度量、整体的度量第一节多维数据模型3.度量的分类与计算分布的:一个聚集函数是分布的,如果它能以如下分布方式进行计算设数据被划分为n个集合,函

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。