数据仓库基本概念ppt课件.ppt

数据仓库基本概念ppt课件.ppt

ID:59266712

大小:783.00 KB

页数:38页

时间:2020-09-22

数据仓库基本概念ppt课件.ppt_第1页
数据仓库基本概念ppt课件.ppt_第2页
数据仓库基本概念ppt课件.ppt_第3页
数据仓库基本概念ppt课件.ppt_第4页
数据仓库基本概念ppt课件.ppt_第5页
资源描述:

《数据仓库基本概念ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据仓库基础知识数据仓库基本概念1.1从传统数据库到数据仓库1.2数据仓库定义及基本特性1.3数据仓库与决策支持系统1.4数据仓库体系结构1.5数据仓库相关概念1.1从传统数据库到数据仓库随着市场竞争的加剧,信息系统的用户已经不满足于仅仅用计算机去处理每天所发生的事务数据,而是需要信息——能够支持决策的信息,去帮助管理决策。这就需要一种能够将日常业务处理中所收集到的各种数据转变为具有商业价值信息的技术,传统数据库系统无法承担这一责任。因为传统数据库的处理方式和决策分析中的数据需求不相称。这些不相称性主要表现在决策处理中的系

2、统响应问题、决策数据需求的问题和决策数据操作的问题。1.1从传统数据库到数据仓库(续)传统的事务处理环境不适宜于决策支持应用事务处理和分析处理的性能特性不同数据集成问题数据动态集成问题历史数据问题数据的综合问题操作型环境和分析型环境的分离:数据抽取现实生活中面临的问题人们在日常生活中经常会遇到这样的情况:超市的经营者希望将经常被同时购买的商品放在一起,以增加销售;保险公司想知道购买保险的客户一般具有哪些特征;医学研究人员希望从已有的成千上万份病历中找出患某种疾病的病人的共同特征,从而为治愈这种疾病提供一些帮助;……企业面临

3、的问题经过多年的计算机应用和市场积累,许多企业保存了大量原始数据和各种业务数据,它是企业生产经营活动的真实记录由于缺乏集中存储和管理,这些数据不能为本企业加以利用,不能进行有效的统计、分析及评估,无法将这些数据转换成企业有用的信息数据爆炸问题自动的数据收集工具和成熟的数据库技术导致巨大的数据存储在文件系统、数据库和其它的信息库中。我们会淹死在数据中,但却为信息、知识所饿!面临的挑战如何在堆积如山的企业交易数据中发现具有商业价值的闪光点?如何使您的企业或组织在激烈的市场竞争中保持对客户的吸引力?如何预先发现和避免企业运作过程

4、中不易察觉的商业风险?数据仓库应运而生数据仓库的出现和发展是数据库和OLTP技术发展、数据库应用深化的产物;目的是把数据库中的大量数据转化为有用信息,为企业更好地进行决策服务。讨论话题一数据仓库产生的源动力是什么?数据仓库系统是数据驱动还是需求驱动的?“我们花了20多年的时间将数据放入数据库,如今是该将它们拿出来的时候了。”----著名的数据仓库专家RalphKimball市场需求是技术发展的源动力1.2数据仓库定义及基本特性1.2.1数据仓库定义1.2.2数据仓库基本特性1.2.1数据仓库定义数据仓库(DataWareh

5、ouse)是一个面向主题的(SubjectOriented)集成的(Integrate)相对稳定的(Non-Volatile)反映历史变化(TimeVariant)的数据集合,用于支持管理决策。1.2数据仓库定义数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。数据仓库之父--BillInmon1.2数据仓库基本特性面向主题性数据集成性数据的时变性数据的非易失性面向主题性面向主题性表示了数据仓库中数据组织的基本原则,数据仓库中的所有数据都是围绕着某一主题组织的。确定主题以后,需要确定主题应该

6、包含的数据。不同的主题之间可能会出现相互重叠的信息。主题在数据仓库中可以用多维数据库方式进行存储。主题的划分中,必须保证每一个主题的独立性。数据集成性根据决策分析的要求,将分散于各处的源数据进行抽取、筛选、清理、综合等工作,最终集成到数据仓库中。业务数据库1业务数据库2……业务数据库n数据仓库抽取转换清洗加载数据的时变性数据应该随着时间的推移而发生变化,不断地生成主题的新快照。存量数据T1时点增量数据……Tn时点增量数据数据仓库抽取转换清洗加载初始主题数据T1时点主题数据……Tn时点主题数据数据的非易失性数据的相对稳定性。

7、数据仓库中的数据只进行刷新,从不进行更新处理。反映历史变化。存量数据T1时点增量数据……Tn时点增量数据数据仓库抽取转换清洗加载初始主题数据T1时点主题数据……Tn时点主题数据时间戳锁定数据讨论话题二数据库和数据仓库有什么不同?数据库与数据仓库的对比对比内容数据库数据仓库数据内容当前值历史的、存档的、归纳的、计算的数据数据目标面向业务操作程序、重复处理面向主题域、管理决策分析应用数据特性动态变化、按字段更新静态、不能直接更新、只定时添加数据结构高度结构化、复杂、适合操作计算简单、适合分析使用频率高中到低数据访问量每个事务只

8、访问少量记录有的事务可能要访问大量记录对响应时间的要求以秒为单位计量以秒、分钟、甚至小时为计量单位1.3数据仓库与决策支持系统决策支持系统的发展阶段初始阶段(DSS阶段)与专家系统结合阶段(IDSS阶段)基于数据仓库技术阶段(BI阶段)基于数据仓库的决策支持系统DSS的先天不足DSS的先天不足决策所需信

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。