数据库与数据仓库的比较.doc

数据库与数据仓库的比较.doc

ID:52759496

大小:41.50 KB

页数:8页

时间:2020-03-30

数据库与数据仓库的比较.doc_第1页
数据库与数据仓库的比较.doc_第2页
数据库与数据仓库的比较.doc_第3页
数据库与数据仓库的比较.doc_第4页
数据库与数据仓库的比较.doc_第5页
资源描述:

《数据库与数据仓库的比较.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、数据库与数据仓库的比较   传统的数据库技术是以单一的数据资源,即数据库为中心,进行从事务处理、批处理到决策分析等各种类型的数据处理工作。然而,不同类型的数据有着不同的处理特点,以单一的数据组织方式进行组织的数据库并不能反映这种差异,特别是满足不了现代商业企业数据处理多样化的要求。随着数据库应用的广泛普及,人们对数据处理的这种多层次特点有了更清晰的认识。总结起来,当前的商业企业数据处理可以大致地划分为两大类:操作型处理和分析型处理。操作型处理也叫事务处理,是指对数据库联机的日常操作,通常是对一个或一组记录的查

2、询和修改,主要是为企业的特定应用服务的,人们关心的是响应时间、数据的安全性和完整性。分析型处理则用于商业企业管理人员的决策分析。两者之间的巨大差异使得操作型处理和分析型处理的分离成为必然。这种分离,划清了数据处理的分析型环境与操作型环境之间的界限,从而由原来的以单一数据库为中心的数据环境发展成为一种新环境:体系化环境。   数据库系统作为数据管理手段,主要用于事务处理。在这些数据库中已经保存了大量的日常业务数据。传统的DSS(决策支持系统)一般是直接建立在这种事务处理环境上的。数据库技术一直力图使自己能胜任从

3、事务处理、批处理到分析处理的各种类型的信息处理任务。尽管数据库在事务处理方面的应用获得了巨大的成功,但它对分析处理的支持一直不能令人满意,尤其是当以业务处理为主的联机事务处理(OLTP)应用与以分析处理为主的DSS应用共存于同一个数据库系统时,两种类型的处理发生了明显的冲突。人们逐渐认识到,事务处理和分析处理具有极不相同的性质,直接使用事务处理环境来支持DSS是行不通的。   具体来说,事务处理环境不适合DSS应用的原因概括起来主要有以下5条:   1、事务处理和分析处理的性能特性不同   在事务处理环境中,

4、用户的行为特点是数据的存取操作频率高而每次操作处理的时间短,因此,系统可以允许多个用户按分时方式使用系统资源,同时保持较短的响应时间,OLTP是这种环境下的典型应用。   在分析处理环境中,用户的行为模式与此完全不同,某个DSS应用程序可能需要连续运行几个小时,从而消耗大量的系统资源。将具有如此不同处理性能的两种应用放在同一个环境中运行显然是不适当的。   2、数据集成问题   DSS需要集成的数据。全面而正确的数据是有效的分析和决策的首要前提,相关数据收集得越完整,得到的结果就越可靠。因此,DSS不仅需要整

5、个企业内部各部门的相关数据,还需要企业外部、竞争对手等处的相关数据。   事务处理的目的在于使业务处理自动化,一般只需要与本部门业务有关的当前数据。而对整个企业范围内的集成应用考虑得很少。当前绝大部分企业内数据的真正状况是分散而非集成的。造成这种分散的原因有很多种,主要有事务处理应用分散、“蜘蛛网”问题、数据不一致问题、外部数据和非结构化数据。   (1)事务处理应用的分散   当前商业企业内部各事务处理应用间实际上几乎都是独立的,之所以出现这种现象有多种原因。有的原因是设计方面的,例如:系统设计人员为了减少

6、系统开发费用和加快开发进度,总是采用简单而“有效”的设计方案,这种“有效”仅指对解决当前面临的问题有效,而不能保证对以后新出现的问题继续有效。有的原因是经济方面的,当经费有限时,一些商业企业总是考虑对关键的业务活动建立应用系统,然后再逐步建立其他业务的信息处理系统。还有的原因是历史、地理方面的,例如:某个大公司由分散在各地的多个子公司组成、企业的兼并等等。由于这种事务处理应用分散状况的存在,DSS应用需要对分散在多个事务处理应用中的相关数据进行集成,以向分析人员提供统一的数据视图。   (2)“蜘蛛网”问题 

7、  DSS应用中为了避免与其他用户的冲突和简化用户的数据视图,一种称为“抽取程序”的方法目前被广泛应用,用户利用抽取程序从文件或数据库中查找有用的数据,然后这些数据被提取出来放入其他文件或数据库中供用户使用。这些经抽取得到的新文件或数据库又被某些用户再进行抽取,这种不加控制的连续抽取最终导致系统内的数据间形成了错综复杂的网状结构,人们形象地称为“蜘蛛网”。企业的规模越大,“蜘蛛网”问题就越严重。   虽然网上的任意两个节点的数据可能归根结底是从一个原始库中抽取出来的,但其数据没有统一的时间基础,抽取算法各不相

8、同,抽取级别也不相同,并且可能参考不同的外部数据。因而对同一问题的分析,不同节点却会产生不同甚至截然相反的结果。这当然使决策者无从下手。   (3)数据不一致问题   前述的应用分散和“蜘蛛网”等多个问题,导致了多个应用间的数据不一致。这些数据不一致的形式是多种多样的:   有时,同一字段在不同应用中具有不同的数据类型。例如:字段Sex在A应用中的值为M/F”,在B应用中的值为“0/1”,在C应用中

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。