数据仓库数据集市概念区别

数据仓库数据集市概念区别

ID:35506667

大小:58.54 KB

页数:3页

时间:2019-03-25

数据仓库数据集市概念区别_第1页
数据仓库数据集市概念区别_第2页
数据仓库数据集市概念区别_第3页
资源描述:

《数据仓库数据集市概念区别》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、数据集市工数据仓库NCR公司可扩展数据仓库解决方案小组干-闯舟编译我们知道,决策支持系统(DSS)主要有两种实现方式,即建立一个数据集市或者一个数据仓库。到底哪一种更能满足决策支持的耍求并几适合企业今后的发展,是近两年来学术界和冇关供应商激烈争论的一个话题。在数据集市领域,主要的供应商和拥护者以美国红砖(RedBrick)公司为代表,其总裁RalphKimball在1997年12月的一篇论文中提岀,〃数据仓库只不过是一些数据集市的集合而已〃。认为企业多建立一些数据集市,将來自然就形成了数据仓库。而业界公认的数据仓库之父Bi

2、llInmon在今年1月立即撰文反驳,旗帜鲜明地指岀,〃你可以在人海屮捕到很多的小鱼并堆积起来,但它们仍然不是鲸〃。在5月份的《数据管理综述》(DataMemagomentReview)中,BillInmon又发表了〃数据集市不等于数据仓库〃的论文,进一步阐述两者在木质上的区别以及各白的适用场合,木文就是根据这篇论文的主要内容编译而成的。问题的捉出现在,各企业IT部门的经理所而临的最主要问题之一是先建立数据仓库述是先建立数据集市。长期以来,数据集市供应商们不断地给他们灌输这样的观念,即建立数据仓库比较复杂,投资过大,设计与

3、开发周期太长,难以集成和管理企业范围内的各种源数据;并认为,基于数据仓库的DSS投资方案难以得到企业管理层的批准。数据集市供应商们给业界描绘了一•幅数据仓库前呆暗淡的图画,这完全是出于自身的口的,是不正确的。数据集市供应商们把数据仓库当成其增加营业收入的绊脚石,口然要避开和攻击数据仓库。事实上,他们在销售时强调数据集市的建设周期短,是以企业信息系统结构的长期规划为代价的。持数据集市主张的人认为,决策支持系统的成功实现,除了数据仓库以外,还有更简便、更冇效的其它途径。方法Z—就是建立多个数据集市,当它们增加得足够大时,那就是

4、所谓的数据仓库了。这些人声称,建立数据集市要快得多也便宜得多,因为当考虑建立一个数据集市时,不必考虑各部门Z间的区别,也不必设立部门Z间协调的规则,更不存在结构设计上的长期规划问题。不幸的是,这种方法虽然避免了建立数据仓库存在的部门协调与规划上的问题,却完全偏离了数据仓库的要点。当企业的信息结构完全由数据集市构成时,其整个组织将变得更加混乱。因为在建立决策支持系统以前,我们可能只是原来的生产系统有些凌乱,现在的状况则可能是凌乱的半产系统再加上朵乱的数据集市。山于企业内所有的决策支持系统均是数据集市,相互Z间没有集成,其结果

5、可想而知一一没有集成的决策支持系统就像没有骨骼的人体一样,是没有实用价值的。方式的改变早期,数据集市供应商们宣称数据集市和数据仓库是相同的系统,试图通过这种偷梁换柱的方式来进入数据仓库市场。在各种展示会期间,他们不遗余力地进行着各种宣传,从而混淆了数据集市与数据仓库的概念。山于这种错误概念的传播,使一•些客户建立了数据集市而非真正的数据仓库。但随着时间的推移,数据集市结构上的缺陷开始眾露出來,主要体现在以下儿点:1)各数据集市Z间对详细数据和历史数据的存储存在大量冗余;2)同一个问题在不同数据集市的查询结果可能不一致甚至相

6、互矛盾;3)各数据集市之间以及与源生产系统之间难以管理。总Z,业界已经普遍认同,一个没冇数据仓库而建立的决策支持系统是很难达到预期效果的。大量事实表明,为了处理决策支持方血的需求,建立数据集市不是正确的途径。在这种悄况下,数据集市供应一商们及其代言人稍微改变了一些原來的说法,向客户承诺成功实施决策支持系统的新方式。和原来不同的是,他们现在宣称,数据仓库只不过是多个数据集市的集成而已。这从另外一方面混淆了数据仓库与数据集市的概念。事实上,这样的论断是矛盾的。因为数据集市的实质就是每个部门拥冇自己的数据,最终用户各自负责自己的

7、业务,相互Z间没有关系,各集市Z间没必要也没办法相互集成。为了理解为什么数据集市不能转变为数据仓库,我们首先必须搞清处两者的定义。框架的不同1.什么是数据集市一般说来,一个数据集市是按照某一特定部门的决策支持需求而组织起来的、针对一组主题的应用系统。例如,财务部拥有口己的数据集市,用来进行财务方面的报表和分析,市场推广部、销售部等也拥有各自专用的数据集市,用來为本部门的决策支持提供辅助手段。这些部门数据集市之间相似之处很少,但最严重的缺点是,每个部门独立拥有自己的硬件平台、软件平台、数据和应用程序。这种关系使得部门之间没有

8、任何约束,而许多数据在整个企业内原本应该是相互制约、相互协调的。这种独立最终导致了不一致性。由于每个部门有自己特定的需求,因此他们対数据集市的期望也不一样。一般说來,数据集市中数据库的设计采用星形连接(Star-Join)的结构,这种结构对部门用户而言是最优的,但对企业范围而言则不然。为了提高星形连接的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。