第二章-数据仓库的基本概念ppt课件.ppt

第二章-数据仓库的基本概念ppt课件.ppt

ID:58579615

大小:3.60 MB

页数:138页

时间:2020-10-20

第二章-数据仓库的基本概念ppt课件.ppt_第1页
第二章-数据仓库的基本概念ppt课件.ppt_第2页
第二章-数据仓库的基本概念ppt课件.ppt_第3页
第二章-数据仓库的基本概念ppt课件.ppt_第4页
第二章-数据仓库的基本概念ppt课件.ppt_第5页
资源描述:

《第二章-数据仓库的基本概念ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、主讲:王名扬信息学院《数据仓库与数据挖掘》引言近年来,由于计算机和网络的应用,计算开始向两个不同的方向拓展:广度计算:将计算机的应用范围扩大,实现广泛的数据交流,如互联网的出现;深度计算:希望计算机参与更多的数据分析与决策制定事务型(操作型)数据处理:数据库分析型数据处理:数据仓库数据处理的环境由原来的以单一数据库为中心的数据环境发展为以数据仓库为基础的体系化环境。第2章数据仓库的基本概念第2章数据仓库的基本概念2.1什么是数据仓库2.2数据立方体2.3数据仓库的三级模型2.4数据仓库的设计2.5提高数据仓库

2、设计性能的几种方法2.1什么是数据仓库1.什么是数据仓库?数据仓库(DataWarehouse)数据仓库是为构建分析型数据处理环境而出现的一种数据存储和组织技术。用来保存从多个数据库或其它信息源选取的数据,并为上层应用提供统一用户接口,完成数据查询和分析。在数据仓库的发展过程中,许多人作出重要贡献:Devlin&Murphy(1988):发表关于数据仓库论述的最早文章;WilliamH.Inmon(1993):《BuildingtheDataWarehouse》,首次系统阐述数据仓库的思想、理论,被尊为“数据

3、仓库之父”。数据仓库(DataWarehouse)数据仓库的定义很多,但却很难有一种严格的定义:它是一个提供决策支持功能的数据库,它与公司的操作数据库分开维护。为统一的历史数据分析提供坚实的平台,对信息处理提供支持。数据仓库是一个面向主题的、集成的、随时间而变化的、不容易丢失的数据集合,支持管理部门的决策过程.---W.H.Inmon数据仓库回答的问题数据仓库将为高层管理人员的科学决策提供可靠依据。去年各个地区各个产品的销售量和销售额?10年以来各厂商每季度的销售额占有比例的变化情况?如果某种产品的销售价格打

4、9折,利润将发生怎样的变化?今年销售量下降的主要因素(时间、地区、部门、商品)是什么?数据仓库的作用两个主要作用:——存储经过加工处理的决策需要的数据※存储数据的一种形式※加工和集成后的再存储——查询和决策分析的依据※为数据驱动型的决策支持提供数据基础数据仓库的关键特征关键特征:面向主题;集成的;随时间而变化的(时变的);不容易丢失的(非易失)。1)面向主题在较高层次上对分析对象的数据进行一个完整、一致的描述,能完整、统一管理各个分析对象所涉及的企业各项数据以及数据之间的联系。—高层次:很高的数据抽象级别,如

5、整个企业、组织1)面向主题面向主题,是数据仓库显著区别于关系数据库系统的一个特征;给出数据仓库中数据组织的基本原则,数据仓库中所有数据都是围绕某一主题组织、展开的;主题是一个在较高层次将数据归类的标准,每一个主题基本对应一个宏观的领域。如,一个生产企业的数据仓库所组织的主题可能是产品订货分析和货物发运分析,而按应用组织的话可能为财务子系统、供应子系统、销售子系统、人力资源子系统和生产调度子系统等。典型的主题领域:客户、产品、交易、账目等。16171)面向主题关注决策者的数据建模与分析,而不是集中于组织机构的日

6、常操作和事务处理。181)面向主题但数据的产生都是基于应用而产生,因此数据在进入数据仓库之前,必然要经过加工和集成,将原始数据结构做一个从面向应用到面向主题的大转变。【例】一家采用“会员制”经营方式的商场,按业务建立起若干子系统,并按业务处理要求建立各自数据库模式:采购子系统:订单(订单号,供应商号,总金额,日期)订单细则(订单号,商品号,类别,单价,数量)供应商(供应商号,供应商名,地址,电话)销售子系统:顾客(顾客号,姓名,性别,年龄,文化程度,地址,电话)销售(员工号,顾客号,商品号,数量,单价,日期)

7、20人事管理子系统:员工(员工号,姓名,性别,年龄,文化程度,部门号)部门(部门号,部门名称,部门主管,电话)库存管理子系统:领料单(领料单号,领料人,商品号,数量,日期)进料单(进料单号,订单号,进料人,收料人,日期)库存(商品号,库房号,库存量,日期)库房(库房号,仓库管理员,地点,库存商品描述)21传统的面向应用进行数据组织方式的特征为:重点在“数据”和“处理”;通常要反映一个企业内数据的动态特征;所生成的各项数据库模式与企业实际的业务处理流程中所涉及的单据及文档,有很好的对应关系。22面向应用到面向主

8、题的转变:面向主题的数据组织方式应分为两个步骤:抽取主题确定每个主题所包含的数据内容仍以商场为例,它所应有的主题包括:商品、供应商、顾客。每个主题有各自独立的逻辑内涵,对应一个分析对象。23商品:商品固有信息:商品号,商品名,类别,颜色等商品采购信息:商品号,供应商号,供应价,供应日期,供应量等商品销售信息:商品号,顾客号,售价,销售日期,销售量等商品库存信息:商品号,库房号,库存量,日期等24

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。