数据仓库设计内容+(中文)-+design+of+data+warehouse.pdf

数据仓库设计内容+(中文)-+design+of+data+warehouse.pdf

ID:57746987

大小:8.49 MB

页数:221页

时间:2020-03-27

数据仓库设计内容+(中文)-+design+of+data+warehouse.pdf_第页
预览图正在加载中,预计需要20秒,请耐心等待
资源描述:

《数据仓库设计内容+(中文)-+design+of+data+warehouse.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、下载第1章决策支持系统的发展信息系统领域是一个“不成熟”的领域。“不成熟”这个词通常具有消极的含义,因而公开使用这个词不得不多加小心。但是从历史的观点来看的确如此。如果我们将信息处理的历史与其他技术领域的历史进行比较的话,就没有争议了。我们知道古埃及的象形文字主要是当时的帐房先生用来表示所欠法老谷子的多少。当漫步在罗马市区,我们就置身于两千多年前土木工程师所设计的街道与建筑物之间。同样,许多其他的领域也可追溯到远古时代。因为信息处理领域只是从60年代初期才出现的,所以,历史地来看,信息处理领域是不成熟的。信息处理领域的年轻性表现之一就是其倾向于面面俱到。有这样

2、一种说法,如果细节都正确了,那么我们就可以坐享其成。这就好象是说,若我们知道如何铺水泥、如何钻孔、如何安装螺母与螺栓,就不必操心桥梁的外型与用途了。如此态度会驱使一个成熟的土木工程师发疯的。数据仓库的历史是伴随某种发展过程开始的,在此发展过程中,业界中人士所考虑的是投入更大的力量。更大规模的体系结构正在被勾勒出来—在这种体系结构中数据仓库处于中心地位。最好从一种广阔的视角去观察这个体系结构,而不是从某种细节去认识。1.1演化有趣的是,决策支持系统(DSS)处理是一个漫长而复杂的演化进程的结果,而且它仍在继续演化。DSS处理的起源可以追溯到计算机发展的初期。图1

3、-1表明了从20世纪60年代初期直到1980年的DSS处理的演化进程。在60年代初期,创建运行于主文件上的单个应用是计算领域的主要工作。这些应用的特点表现在报表和程序,常用的是COBOL语言。穿孔卡是当时常用的介质。主文件存放在磁带文件上。磁带适合于廉价地存放大容量数据,但缺点是需要顺序地访问。事实上,我们常说,在磁带文件的一次操作中,100%的记录都要被访问到,但是只有5%或更少的记录是真正需要的。此外,访问整条磁带的文件可能要花去20~30分钟时间,这取决于文件上是什么数据及当前正在做什么处理。大约在60年代中期,主文件和磁带的使用量迅速膨胀。很快,处处都

4、是主文件。随着主文件数量的增长,出现大量冗余数据。主文件的迅速增长和数据的巨大冗余引出了一些严重问题:■需要在更新数据时保持数据的一致性。■程序维护的复杂性。■开发新程序的复杂性。■支持所有主文件需要的硬件数量。简言之,属于介质本身固有缺陷的主文件的问题成为发展的障碍。如果仍然只用磁带作为存储数据的唯一介质,那么难以想象现在的信息处理领域会是什么样子。2发展数据仓库下载主文件,报表1960¥复杂性¥维护¥开发1965¥数据的一致性¥硬件很多主文件!!!1970DASD数据库—所有处理的DBMS单一数据源1975联机高性能事务处理1980个人计算机第四代程序设计

5、语言技术tx处理MIS/DSS单一数据库服务于完成所有目的图1-1体系化环境的早期演化阶段如果除了磁带文件以外没有别的东西可以存储大量数据,那么世界上将永远不会有大型、快速的预定系统,ATM系统,以及其他系统。而事实上,在除磁带文件之外的种种介质上存储和管理数据的能力,为采用不同的处理方式和更强有力的处理类型开辟了道路,从而把技术人员和商务人员前所未有地聚集到一起。1.2直接存取存储设备的产生到了1970年,一种存储和访问数据的新技术出现了。这就是20世纪70年代见到的磁盘存第1章决策支持系统的发展发展3下载储,或者称之为直接存取存储设备(DASD)。磁盘存储

6、从根本上不同于磁带存储,因为DASD上的数据能够直接存取。DASD就不需要经过第1条记录,第2条记录⋯⋯,第n条记录,才能得到第n+1条记录。一旦知道了第n+1条记录的地址,就可以轻而易举地直接访问它。进而,找到第n+1条记录需要的时间比起扫描磁带的时间少得多。事实上,在DASD上定位记录的时间是以毫秒(ms)来计量的。随DASD而来的是称之为数据库管理系统(DBMS)的一种新型系统软件。DBMS的目的是使程序员在DASD上方便地存储和访问数据。另外,DBMS关心的是在DASD上存储、索引数据等任务。随着DASD和DBMS的出现,解决主文件系统问题的一种技术解

7、决方案应运而生。“数据库”的思想就是DBMS的产物。纵观主文件系统所导致的混乱以及主文件系统累积的大量冗余数据,就不会奇怪为什么把数据库定义为—所有处理工作的单一数据源。但这一领域的发展并未在1970年停止。到70年代中期,联机事务处理开始取代数据库。通过终端和合适的软件,技术人员发现更快速地访问数据是可能的—这就开辟了一种全新的视野。采用高性能联机事务处理,计算机可用来完成以前无法完成的工作。当今,计算机可用于建立预定系统、银行柜员系统、工业控制系统,等等。如果仍然滞留在磁带文件系统时代,那么今天我们认为理所当然的大多数系统就不可能存在了。1.3个人计算机/

8、第四代编程语言技术到了80年代,一些更

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。