数据仓库的基本概念

数据仓库的基本概念

ID:40506421

大小:426.60 KB

页数:129页

时间:2019-08-03

数据仓库的基本概念_第1页
数据仓库的基本概念_第2页
数据仓库的基本概念_第3页
数据仓库的基本概念_第4页
数据仓库的基本概念_第5页
资源描述:

《数据仓库的基本概念》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、课程安排数据仓库:18学时 数据挖掘:18学时 考试:撰写论文第一章数据仓库的基本概念案例讨论:下图展示了某电信公司的市场部和计划部对业务A是否具有市场前景的分析过程和结果。试讨论为什么两部门分析结果不同。企业级数据库市场部分析程序1分析结果1:前景很好计划部分析程序2分析结果2:前景不好第一章:数据仓库的基本概念1-1数据仓库的产生与发展传统的数据库技术作为数据管理手段,主要用于联机事务处理(OLTP,On-LineTransactionProcess),数据库中保存的是大量的日常业务数据。在数据共享、数据与应用程序的独立性、维护数据的一致性与完整性、数据的安全保密性等方面提供了

2、有效的手段。第一章数据仓库的基本概念与分析型应用结合时存在的问题:决策支持系统为掌握充分的信息,需要访问大量的企业内部数据和外部数据。企业中存在不同的操作型MIS即不同的数据源;不同的数据管理平台信息提取不方便。如:OracleSQLServer……传统数据库中的大量数据是事务型数据,即该数据是对每一项工作、管理对象的具体的、细节性的描述。如:一份合同;DSS需要的是综合的、总结性数据。其特点:数据量大。基与传统的操作型DB不适合建立分析型应用系统。第一章数据仓库的基本概念与分析型应用结合时存在的问题(续):事务处理型应用与分析决策型应用对数据库系统的性能要求不同。事务处理型应

3、用特点:数据存取频率高、处理时间短;分析决策型应用特点:数据存取频率低、处理时间长。将分析决策型应用与事务处理型应用共同放在同一DBS环境中系统资源紧张事务处理型应用瘫痪。传统数据库中保存和管理的一般是当前数据,而决策支持系统不仅需要当前的数据,而且还要求有大量的历史数据进行分析和比较找出企业发展变化趋势。传统的数据库系统不能满足分析决策型应用的需要。结论:(1)在事务处理型应用环境中直接构建分析决策型应用不可行的。(2)面向分析决策型应用的数据及数据处理与事务处理型应用的数据及数据处理分离。即必须把分析决策型数据从事务处理系统应用环境中分离开来,建立单独的分析性应用环境。

4、于是:面向分析决策型应用而组织和存储数据的数据仓库技术应运而生。第一章数据仓库的基本概念时间:20世纪80年代初人物:W.H.Inmon定义:数据仓库是面向主题的、集成的、具有时间特征的、稳定的数据集合,用以支持经营管理中的决策制定过程。Adatawarehouseisasubject-oriented,integrated,time-variant,andnonvolatilecollectionofdatainsupportofmanagement’sdecisionmakingprocess.第一章数据仓库的基本概念数据仓库的四大特征:数据是面向主题的数据是集成的数据是具有时

5、间特征的数据是相对稳定的数据仓库的其它特点:数据量非常大(10GB---1000GB)是数据库技术的一种新的应用使用人员较少第一章数据仓库的基本概念1-2数据仓库与数据库操作型数据库分析型数据仓库系统目的支持日常操作支持管理需求,获取信息使用人员办事员、DBA、数据库专家经理、管理人员、分析专家数据内容当前数据历史数据、派生数据数据特点细节的综合的或提炼的数据组织面向应用面向主题存取类型添加、修改、查询、删除查询、聚集数据稳定性动态的相对稳定第一章数据仓库的基本概念续上表:操作型数据库分析型数据仓库需求特点需求事先可知道需求事先不知道操作特点一个时刻操作一单元一个时刻操作一集合数据

6、库设计基于E-R图基于星型模式、雪花模式一次操作数据量一次操作数据量小一次操作数据量大存取频率较高较低响应时间小于3秒几秒—几十分钟第一章数据仓库的基本概念1-3数据仓库的基本结构操作型事物处理系统设计目的:简单检索(少量记录的日常操作)复杂的分析型数据仓库设计目的:复杂查询(大量数据汇总和分类)技术人人使用角度分:体系结构用户使用角度分:数据仓库的基本结构由四部分组成:数据仓库的基本结构(续)1.数据源(DataSource)提供原始数据:内部数据源(MIS-遗传系统)、外部数据源(调查或统计数据)、历史数据例:营销分析(发票、合同、客户、计划、产品结构、地区、市场数据等)2.数

7、据仓库的数据存储(DataStorage)数据源接收、分析、抽取、净化、汇总、变换、存储、清理、转换确定分析主题抽取面向主题的集成数据确定数据模型DW数据仓库的基本结构(续)3.应用工具(ApplicationTools)OLAP(On-LineAnalyticalProcessing)工具:支持复杂但目的明确的分析操作。如:2011与2010比,产品P在地区R的销售增长是多少?其特点:a).应分析人员的要求可快速灵活进行大量数据的复杂的查询处理;b).通过

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。