数据仓库1-数据仓库概述.ppt

数据仓库1-数据仓库概述.ppt

ID:56373716

大小:3.16 MB

页数:57页

时间:2020-06-14

数据仓库1-数据仓库概述.ppt_第1页
数据仓库1-数据仓库概述.ppt_第2页
数据仓库1-数据仓库概述.ppt_第3页
数据仓库1-数据仓库概述.ppt_第4页
数据仓库1-数据仓库概述.ppt_第5页
资源描述:

《数据仓库1-数据仓库概述.ppt》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库

1、第1讲数据仓库概述1数据仓库概述1.1数据仓库产生的原因1.2数据仓库的基本概念1.3数据仓库的体系结构2数据仓库概述1.1数据仓库产生的原因1.1.1操作型数据处理1.1.2分析型数据处理1.1.3两种数据处理模式的差异1.1.4数据库系统的局限性31.1数据仓库产生的原因两者有何不同?数据库:存放数据的地方。数据仓库:存放数据的地方。41.1数据仓库产生的原因两者有何不同?数据库:存放数据的地方。数据仓库:存放数据的地方。51.1数据仓库产生的原因两者有何不同?数据库:存放数据的地方。数据仓库:存放数据的地方。61.1数据仓库产生的

2、原因71.1数据仓库产生的原因81.1数据仓库产生的原因两者有何不同?数据库:存放数据的地方。数据仓库:存放数据的地方。91.1数据仓库产生的原因数据处理的类型操作型处理(OLTP):数据的收集、整理、存储、查询和增、删、改操作。分析型处理(OLAP):数据的再加工,往往要访问大量的历史数据,进行复杂的统计分析。101.1.1操作型数据处理是数据库系统的主要应用特点:数据存取频率高、响应时间要快、存取数据量小、数据存储正确可靠。系统基本架构:数据库用户用户用户数据库管理系统应用系统111.1.1操作型数据处理为了有效地对事务进行处理,数

3、据库管理系统在技术和管理上采取了很多措施:提出了事务的概念采用日志、备份等恢复技术和并发控制技术采用索引技术快速定位数据121.1.1操作型数据处理在数据库设计中广泛采用了规范化理论,消除表中属性间的部分函数依赖和传递函数依赖。消除了数据的冗余,缩短了数据处理时间。131.1.2分析型数据处理典型的分析型应用就是决策支持系统。需要具备的基本功能是:建立各种数学模型,对数据统计分析,得出有用的信息作为决策的依据。141.1.2分析型数据处理常规应用实例:某产品的销售经理希望通过调整该产品在各零售店的分配数量来扩大其销售量。需要查询历史数据

4、库中各类零售店最近若干年(例如5年)内每天的销售记录。统计运算计算出近5年来各店的年度销售量。比较确定销售量增长较快的零售店。151.1.2分析型数据处理决策支持系统:需要花数小时甚至更长时间的处理、需要遍历数据库中的大部分数据,进行复杂的计算,需要消耗大量的系统资源。161.1.3两者数据处理模式的差别操作型数据分析型数据细节的综合的,或提炼的当前数据历史数据更新的不可更新,只读的生命周期符合SDLC(软件开发生命周期)完全不同的生命周期对性能要求高对性能要求宽松一个时刻操作一个单元一个时刻操作一个集合事务驱动分析驱动面向应用面向分析

5、一次操作数据量小,计算简单一次操作数据量大,计算复杂支持日常操作支持管理需求171.1.4数据库系统的局限传统的数据库系统在操作型数据处理应用中取得了巨大的成功。将其应用到分析型数据处理方面却无能为力。181.1.4数据库系统的局限信息系统建设的阶段性和分布性的特点,导致“信息孤岛”的存在。191.1.4数据库系统的局限201.1.4数据库系统的局限(续)1)数据的分散联机事务处理系统一般只需要与本部门业务相关的当前数据。企业内部各应用之间实际上几乎都是独立的。212)“蜘蛛网”问题解决数据分散的一种方法就是对数据进行集成抽取程序带来了

6、“蜘蛛网”问题,即需要在抽取的数据中再次抽取,将导致企业数据之间形成错综复杂的网状结构。1.1.4数据库系统的局限223)数据不一致问题由于数据分散,导致多个应用间的数据不一致:同一字段在不同应用中具有不同的数据类型同一字段在不同应用中具有不同的名字字段名字相同,但含义不同1.1.4数据库系统的局限234)数据动态集成问题数据集成开销很大。一些应用仅在开始时对进行集成,以后一直以这部分集成数据作为分析基础,称为静态集成。导致决策者使用过时数据。如果希望能够用上最新数据,每次分析之前都进行数据集成,称为动态集成。联机事务处理系统不具备动态

7、集成能力。1.1.4数据库系统的局限245)历史数据问题联机事务处理一般只需要当前数据,数据库适于存储高度结构化的日常事务细节数据。决策型数据多为历史性、汇总性或计算性数据。1.1.4数据库系统的局限256)数据的综合问题联机事务处理系统中积累了大量的细节数据,决策支持系统并不对细节数据进行分析。决策分析环境中,细节数据量太大一方面会严重影响分析效率,另一方面这些细节数据会分散决策者的注意力。因此分析前,需要对细节数据进行不同程度的综合。1.1.4数据库系统的局限26结论要提高分析和决策的效率和有效性,必须把分析数据从事务处理环境中提取

8、出来,按照决策支持系统处理的需要进行重新组织,建立单独的分析型处理环境。数据仓库正是为了构建这种新的分析型处理环境而出现的一种数据存储和组织技术。1.1.4数据库系统的局限27数据仓库概述1.1数据仓库产生

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。