数据库原理与应用教程 教学课件 第14章 数据仓库与数据挖掘.ppt

数据库原理与应用教程 教学课件 第14章 数据仓库与数据挖掘.ppt

ID:51969353

大小:1.28 MB

页数:57页

时间:2020-03-26

数据库原理与应用教程 教学课件 第14章 数据仓库与数据挖掘.ppt_第1页
数据库原理与应用教程 教学课件 第14章 数据仓库与数据挖掘.ppt_第2页
数据库原理与应用教程 教学课件 第14章 数据仓库与数据挖掘.ppt_第3页
数据库原理与应用教程 教学课件 第14章 数据仓库与数据挖掘.ppt_第4页
数据库原理与应用教程 教学课件 第14章 数据仓库与数据挖掘.ppt_第5页
资源描述:

《数据库原理与应用教程 教学课件 第14章 数据仓库与数据挖掘.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据库原理与应用教程(第4版)国家“十一五”规划教材第14章数据仓库与数据挖掘14.1数据仓库技术14.2联机分析处理14.3数据挖掘14.1数据仓库技术14.1.1数据仓库的概念及特点14.1.2数据仓库体系结构14.1.3数据仓库的分类14.1.4数据仓库的开发数据仓库技术数据仓库是进行联机分析处理和数据挖掘的基础,它从数据分析的角度将联机事务中的数据经过清理、转换并加载到数据仓库中,这些数据在数据仓库中被合理的组织和维护,以满足联机分析处理和数据挖掘的要求。14.1.1数据仓库的概念及特点

2、面向主题集成的数据数据不可更新数据随时间不断变化使用数据仓库是为了更好的支持制定决策面向主题主题是一种抽象,它是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用,是对企业中某一宏观分析领域所涉及的分析对象,是针对某一决策问题而设置的。面向主题的数据组织方式就是完整、统一地刻画各个分析对象所涉及的企业的各项数据以及数据之间的联系。在关系数据库中,每个主题由一组相关的关系表或逻辑视图来具体实现。主题中的所有表都通过一个公共键联系起来,数据可以存储在不同的介质上,而且相同的数据可以既有综合级

3、又有细节级。集成的数据数据仓库中存储的数据是从原来分散的各个子系统中提取出来的,但并不是原有数据的简单拷贝,而是经过统一、综合这样的过程。原因:源数据不适合分析处理,在进入数据仓库之前必须经过综合、清理等过程,抛弃分析处理不需要的数据项,增加一些可能涉及的外部数据。数据仓库每个主题所对应的源数据在原分散数据库中有许多重复或不一致的地方,因而必须对数据进行统一,消除不一致和错误的地方,以保证数据的质量。数据不可更新从数据的使用方式上看,数据仓库的数据不可更新是指当数据被存放到数据仓库之后,最终用户

4、只能进行查询、分析操作,而不能修改其中存储的数据。数据随时间不断变化数据仓库的数据不可更新,但并不是说,数据从进入数据仓库以后就永远不变。从数据的内容上看,数据仓库存储的是企业当前的和历史的数据。因而每隔一段固定的时间间隔后,操作型数据库系统产生的数据需要经过抽取、转换过程以后集成到数据仓库中。数据仓库中的数据随时间变化而定期地更新。数据仓库体系结构操作型数据与分析型数据的区别原始数据/操作型数据导出数据/DSS数据面向应用,支持日常操作面向主题,支持管理需求数据详细,处理细节问题综合性强,或经

5、过提炼存取的瞬间是准确值代表过去的数据可更新不可更新重复运行启发式运行事务处理驱动分析处理驱动非冗余性时常有冗余处理需求事先可知,系统可按预计的工作量进行优化处理需求事先不知道对性能要求高对性能要求宽松用户不必理解数据库,只是输入数据即可用户需要理解数据库,以从数据中得出有意义的结论数据仓库的分类按照数据仓库的规模与应用层面来区分,数据仓库大致可分为下列几种:标准数据仓库。数据集市。多层数据仓库。联合式数据仓库。标准数据仓库是企业最常使用的数据仓库,它依据管理决策的需求而将数据加以整理分析,再将

6、其转换到数据仓库之中。这类数据仓库是以整个企业为着眼点而建构出来的,其数据都与整个企业的数据有关,用户可以从中得到整个组织运作的统计分析信息。数据集市针对某一主题或是某个部门而构建的数据仓库,规模会比标准数据仓库小,且只存储与部门或主题相关的数据,是数据体系结构中的部门级数据仓库。通常用于为单位的职能部门提供信息。例如,为是销售部门、库存和发货部门、财务部门、高级管理部门等提供有用信息。还可用于将数据仓库数据分段以反映按地理划分的业务,其中每个地区都是相对自治的。多层数据仓库是标准数据仓库与数据

7、集市的组合应用方式在整个架构之中,有一个最上层的数据仓库提供者,它将数据提供给下层的数据集市。数据仓库销售数据集市市场数据集市商店数据集市用户用户用户数据仓库的开发自顶向下,即从全面设计整个企业的数据仓库模型开始。这是一种系统的解决方法,并能最大限度的减少集成问题,但费用高,开发时间长,且缺乏灵活性,因为使整个企业的数据仓库模型要达到一致是很困难的。自底向上,从设计和实现各个独立的数据集市开始。这种方法费用低,灵活性高,并能快速的回报投资。推荐的数据仓库开发方法数据仓库的数据模式典型的数据仓库具

8、有为数据分析而设计的模式,供OLAP工具进行联机分析处理。数据通常是多维的,包括维属性和度量属性,维属性是分析数据的角度,度量属性是要分析的数据,一般是数值型的。包含统计分析数据的表称为事实数据表,通常比较大。数据仓库的架构星型架构雪花型架构星型架构维度表只与事实表关联,维度表彼此之间没有任何联系。每个维度表都有一个且只有一个列作为主码,该主码连接到事实数据表中的一个列上。雪花型架构将一个维度表分解为多个表,每个表都连接到主维度表。14.2联机分析处理联机分析处理(OLAP)是专门为支持复杂的分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。