《数据仓库原理》PPT课件

《数据仓库原理》PPT课件

ID:38901097

大小:6.44 MB

页数:99页

时间:2019-06-21

《数据仓库原理》PPT课件_第1页
《数据仓库原理》PPT课件_第2页
《数据仓库原理》PPT课件_第3页
《数据仓库原理》PPT课件_第4页
《数据仓库原理》PPT课件_第5页
资源描述:

《《数据仓库原理》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、DataWarehouseandDataMining第2章数据仓库原理北京邮电大学计算机学院王小茹内容提要数据仓库的结构和技术要求数据仓库中的数据元数据2.1数据仓库的结构与技术要求数据仓库的总体结构数据集市数据仓库的技术要求1.数据仓库的概念结构数据源、数据准备区、数据仓库数据库、数据集市/知识挖掘库以及各种管理工具和应用工具数据仓库的概念结构数据仓库在创建以后:首先要从数据源中抽取所需要的数据到数据准备区,在数据准备区中经过数据的净化处理再加载到数据仓库数据库中最后根据用户的需求将数据发布到数据集市/知识挖掘库中。当用户使用数据仓库时,可以通过OLAP等数据仓库应

2、用工具向数据集市/知识挖掘库或数据仓库进行决策查询分析或知识挖掘。2.数据仓库的总体层次结构为实现数据仓库的功能,数据仓库的总体层次结构包括:数据仓库基本功能层数据库仓库管理层数据仓库环境支持层(1)数据仓库的基本功能层从数据源抽取数据对所抽取的数据进行筛选、清理,将清理后的数据加载到数据仓库中根据用户的需求设立数据集市,完成数据仓库的复杂查询、决策分析和知识的挖掘等功能。(2)数据仓库的管理层数据仓库的管理层包含数据管理与元数据管理两部分。数据管理与元数据管理主要负责对数据仓库中的数据抽取、清理、加载、更新与刷新等操作进行管理.(3)数据仓库环境支持层数据仓库环境支

3、持层主要包含数据传输和数据仓库基础两大部分。数据仓库的总体层次结构3.数据仓库的结构模式数据仓库作为数据存储的一种组织形式,它从最初的数据源获得原始数据,按照决策的要求重新组织,形成具有不同粒度的综合数据层,这是数据仓库结构的一个方面。数据仓库还需要对其中存储的数据进行操纵、管理等,以支持决策,这是数据仓库结构的另一方面。(1)数据仓库的自顶向下结构自顶向下结构这种结构开始于对原始数据的处理。包括抽取、转换、迁移等处理过程,用于将传统数据库或外部数据源的数据处理后输出到一个集中的数据驻留单元。随后,数据和元数据装载进入数据仓库。一旦这些过程完成,就可根据数据仓库所包含

4、的各种数据来建立数据集市。在数据仓库中不但包含全部的元数据、当前详细数据,同时还存储详尽的历史数据。数据集市则拥有轻度和高度综合的数据及元数据。发展状况在自顶向下的结构中,数据仓库普遍采用实体关系(EntityRelationship,E-R)数据模型,而数据集市则采用星形数据模型来提高性能。只要能满足数据集市是作为数据仓库子集的这条原则,数据仓库和数据集市间的集成就能自动完成。这种模式要求首先建立数据仓库,但是由于数据仓库建设规模较大,实施周期长,费用高,初期效果并不明显,甚至最终失败,致使许多企业不愿或无法承受。2.数据仓库的自底向上的结构数据仓库的自底向上的结构

5、基于上述情况,一种自底向上建设多级数据仓库的思想也就产生了,即建立数据集市的思想。这种思想的核心是从最关键的部分开始,先以最少的投资,完成企业当前需求,获得最快的回报,然后再不断扩充,不断完善、通过从小做起、从部分做起,走逐步集成、逐步完善的道路,最终建立全局数据仓库。这种结构有助于部门级管理人员合理安排预算和及时采用新的数据仓库技术来产生合乎自己角色的专门应用。自底向上的结构逐渐为人们所认同。数据仓库的构建过程自底向上结构的核心是通过独立开发的数据集市逐渐构建数据仓库。这种结构的流程从建立数据集市的抽取、转换、转移和装载过程开始,在这些过程中,不需要一个通用的数据驻

6、留单元,因为每个数据集市都可能有自己独立的存储区域,甚至每个数据集市的数据抽取、转换、转移和装载的工具都可能不同。自底向上VS自定向上从集成的角度来看,自底向上与自顶向下结构的最大差异在于:前者不需要为创建数据集市而具备通用的元数据部件。2.1.2数据集市数据仓库在管理、决策组织中的作用逐渐为人们认同,但是在全组织范围内构建数据仓库的工作量大、代价很高。一方面,如何满足组织中不同层次管理决策要求是一个需要解决的复杂问题;另一方面,在实施过程中由于很难全面了解组织管理决策要求,易造成项目进度拖延,建成的数据仓库起不到应有的作用,因此导致失败的例子也不鲜见。提出了数据集市

7、(DataMart)的概念。什么是数据集市数据仓库在全组织范围内为各个部门提供管理、决策支持,而数据集市通常在部门级,一般只能为某个局部范围内的管理人员服务,因此也称之为部门级数据仓库.(DepartmentDataWarehouse)数据集市是指具有特定应用的数据仓库,主要针对某个具有战略意义的应用或具体部门级的应用,支持用户利用已有的数据进行管理决策。数据集市的特点数据集市除具有数据仓库的基本特征以外,还具有以下特点:①规模较小,灵活,可以按照多种方式来组织,如按特定的应用等。②开发工作一般由业务部门主持定义、设计、实施、管理和维护。③能够快速实

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。