数据仓库课件3

数据仓库课件3

ID:44041494

大小:375.00 KB

页数:59页

时间:2019-10-18

数据仓库课件3_第1页
数据仓库课件3_第2页
数据仓库课件3_第3页
数据仓库课件3_第4页
数据仓库课件3_第5页
资源描述:

《数据仓库课件3》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第3章数据仓库开发应用过程数据仓库的开发应用像生物一样具有其特有的、完整的生命周期,数据仓库的开发应用周期可以分成:数据仓库规划分析阶段、数据仓库设计实施阶段以及数据仓库的使用维护三个阶段。这三个阶段是一个不断循环、完善、提高的过程。在一般情况下数据仓库系统不可能在一个循环过程中完成,而是经过多次循环开发,每次循环都会为系统增加新的功能,使数据仓库的应用得到新的提高。3.1数据仓库开发应用的特点3.1.1数据仓库开发应用的阶段性数据仓库的开发应用过程划分为:1、创始阶段:往往是为了满足一种明确的商业需求,倾向于建立一个小型数据仓库来提供管理报表和决策查询。这些数据仓库只能称之为数据集市,这种

2、数据仓库的开发方法会限制企业各个部门今后的信息分享。2、成长阶段:在这个阶段,为更多的应用开始建立更多的数据仓库。随着多个部门分散数据仓库的建立开始引发大量的问题。3、控制阶段:在这个阶段需要用控制和整合的方法将各个主题数据仓库整合,从而将多个数据仓库结合起来形成一个决策支持环境。4、成熟阶段:成熟的数据仓库具有以下特征:企业聚焦于集成的信息、大量的来源和不断发展的主题领域、有多种用途的单一业务模型、数据的快速采集与加入、广泛的交易采集和使用、以客户为中心、惟一的真实版本、广泛的访问和管理安全、跨部门的应用、从属的数据集市或从属的数据仓库、使用数据仓库支持管理决策活动。3.1.2数据仓库的螺

3、旋式开发方法设计体系结构开发概念模型开发逻辑模型数据库与元数据设计数据抽取转换与加载开发中间件填充与测试数据仓库数据仓库应用数据仓库维护数据仓库评价规划与确定需求规划分析阶段数据仓库开发过程设计实施使用维护阶段阶段3.13数据仓库开发特点1、数据仓库开发是从数据出发的创建数据仓库是在原有数据库系统中数据的基础上进行的,即从存在于业务处理系统环境中的数据出发进行数据仓库的创建。这种从已有数据出发的数据仓库设计方法称为“数据驱动”的设计方法。2、数据仓库使用的需求不能在开发初期明确面向应用的数据库系统设计往往有一组较确定的应用需求,这是数据库系统设计和开发的出发点和基础。在数据仓库的开发初期往往

4、不能明确了解数据仓库用户的使用需求。3、数据仓库的开发是一个不断循环的启发过程3.2数据仓库的规划3.2.1选择数据仓库实现策略开发策略主要有:自顶向下:实际应用比较困难。该方法的使用需要开发人员具有丰富的自顶向下开发系统的经验,企业决策层和管理人员完全知道数据仓库使用的预定目标并了解数据仓库能够在哪些决策中发挥作用。自底向上:用于一个数据集市或一个部门的数据仓库开发,容易获得成功。两种策略的联合使用:能够快速地完成数据仓库的开发与应用,而且还可以建立具有长远价值的数据仓库方案。在实际使用中难以操作。3.2.2确定数据仓库的开发目标和实现范围首要目标是确定所需要信息的范围,确定数据仓库在为用

5、户提供决策帮助时,在主题和指标领域需要哪些数据源。另一个重要目标是确定利用哪些方法和工具访问和导航数据?其它目标是确定数据仓库内部数据的规模3.2.3数据仓库的结构1.数据仓库的应用结构基于业务处理系统的数据仓库。在这种数据仓库结构中,数据仓库应用程序不对基于业务处理系统的数据进行任何修改,只是对业务系统中的数据进行只读操作。具有这种结构的数据仓库的元数据库是一种虚拟数据仓库,它指向业务数据库的元数据,而不是数据仓库自身的元数据。在数据仓库元数据库的直接指导下,对仓库的查询就是简单地从业务数据库中抽取数据。单纯数据仓库。利用在数据仓库中的数据源净化、集成、概括等操作将数据源从业务处理系统传入

6、集中的数据仓库,各部门的数据仓库应用只在数据仓库中进行。这种结构经常在多部门、少用户使用数据仓库的情况下采用。单纯数据集市。数据集市是指只在部门中使用的数据仓库。数据仓库和数据集市。企业各部门拥有满足自已特殊需要的数据集市,其数据从企业数据仓库中获取,而数据仓库则从企业各种数据源中收集和分配。这种体系结构是一种较为完善的数据仓库体系结构。2.数据仓库的技术平台结构(1)单层结构。单层结构主要是指在数据源和数据仓库之间共享平台,或者让数据源、数据仓库、数据集市与最终用户工作站使用同一个平台。共享一个平台可以降低数据抽取和数据转换的复杂性,但是共享平台在应用中可能会遇到性能和管理方面的问题。(2

7、)客户机/服务器两层结构。一层为客户层,一层为服务器,最终用户访问工具在客户层上运行,而数据源、数据仓库和数据集市位于服务器上。(3)三层客户机/服务器。基于工作站的客户层、基于服务器的中间层和基于主机的第三层。主机层负责管理数据源和可选的源数据转换,服务器运行数据仓库和数据集市软件,并存储仓库的数据,客户工作站运行查询和报表应用程序,有的还可以存储从数据集市或数据仓库卸载的局部数据。(4)多层式结构。这是在

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。