数据仓库与数据挖掘课件ppt

数据仓库与数据挖掘课件ppt

ID:1507332

大小:174.50 KB

页数:58页

时间:2017-11-12

数据仓库与数据挖掘课件ppt_第1页
数据仓库与数据挖掘课件ppt_第2页
数据仓库与数据挖掘课件ppt_第3页
数据仓库与数据挖掘课件ppt_第4页
数据仓库与数据挖掘课件ppt_第5页
资源描述:

《数据仓库与数据挖掘课件ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、课程安排数据仓库:18学时 数据挖掘:18学时 考试:撰写论文第一章数据仓库的基本概念案例讨论:下图展示了某电信公司的市场部和计划部对业务A是否具有市场前景的分析过程和结果。试讨论为什么两部门分析结果不同。企业级数据库市场部分析程序1分析结果1:前景很好计划部分析程序2分析结果2:前景不好第一章:数据仓库的基本概念1-1数据仓库的产生与发展传统的数据库技术作为数据管理手段,主要用于联机事务处理(OLTP,On-LineTransactionProcess),数据库中保存的是大量的日常业务数据。在数据共享、数据与应用程序的独立性、维护数据

2、的一致性与完整性、数据的安全保密性等方面提供了有效的手段。第一章数据仓库的基本概念与分析型应用结合时存在的问题:决策支持系统为掌握充分的信息,需要访问大量的企业内部数据和外部数据。传统数据库中的大量数据是事务型数据,即该数据是对每一项工作、管理对象的具体的、细节性的描述。事务处理型应用与分析决策型应用对数据库系统的性能要求不同。传统数据库中保存和管理的一般是当前数据,而决策支持系统不仅需要当前的数据,而且还要求有大量的历史数据。第一章数据仓库的基本概念结论:在事务处理型应用环境中直接构建分析决策型应用是不可行的。于是:面向分析决策型应用

3、而组织和存储数据的数据仓库技术应运而生。第一章数据仓库的基本概念时间:20世纪80年代初人物:W.H.Inmon定义:数据仓库是面向主题的、集成的、具有时间特征的、稳定的数据集合,用以支持经营管理中的决策制定过程。Adatawarehouseisasubject-oriented,integrated,time-variant,andnonvolatilecollectionofdatainsupportofmanagement’sdecisionmakingprocess.第一章数据仓库的基本概念数据仓库的四大特征:数据是面向主题的数

4、据是集成的数据是具有时间特征的数据是相对稳定的数据仓库的其它特点:数据量非常大(10GB---1000GB)是数据库技术的一种新的应用使用人员较少第一章数据仓库的基本概念1-2数据仓库与数据库操作型数据库分析型数据仓库系统目的支持日常操作支持管理需求,获取信息使用人员办事员、DBA、数据库专家经理、管理人员、分析专家数据内容当前数据历史数据、派生数据数据特点细节的综合的或提炼的数据组织面向应用面向主题存取类型添加、修改、查询、删除查询、聚集数据稳定性动态的相对稳定第一章数据仓库的基本概念续上表:操作型数据库分析型数据仓库需求特点需求事先

5、可知道需求事先不知道操作特点一个时刻操作一单元一个时刻操作一集合数据库设计基于E-R图基于星型模式、雪花模式一次操作数据量一次操作数据量小一次操作数据量大存取频率较高较低响应时间小于3秒几秒—几十分钟第一章数据仓库的基本概念1-3数据仓库技术的术语主题:(Subject)主题是一个在较高层次上将数据归类的标准,每一个主题基本对应一个宏观的分析领域。例:面向主题:产品订货分析,货物发运分析,新产品开发分析;面向应用:财务,销售,供应,人力资源,生产调度…….主题域的特征:独立性,完备性第一章数据仓库的基本概念粒度:(Granularity

6、)粒度是指数据仓库中数据单元的详细程度和级别。数据越详细,粒度越小,级别越低,回答查询的种类就越多。(数据堆积,回答综合问题效率低)数据越综合,粒度越大,级别越高,回答查询的种类就越少。第一章数据仓库的基本概念维度:(Dimension)维度是指人们观察事物的角度。例如:当人们关注产品销售情况时,有如下维度:时间维:随时间变化的销售数据;地区维:不同地区的销售数据;客户维:不同客户的销售;……根据观察事物角度的细节程度不同,维又具有维层次。数据;渠道维:不同销售渠道的销售数据;产品维:不同产品的销售数据例:时间维:日期、周、月份、季度、

7、年等;地区维:城市、地区、国家等。第一章数据仓库的基本概念数据立方体:数据立方体是指由两个或更多个属性即两个或更多个维来描述或者分类的数据。在三维的情况下可以用图形来表示,一般称为数据立方体。实际的数据仓库的应用中,数据是多维的。第一章数据仓库的基本概念联机分析处理:(OLAP)联机分析处理是快速、灵活的多维数据分析工具。OLAP的目的是支持分析决策,满足多维环境的查询和报表需求。数据仓库的多维数据存储结构为OLAP的实施提供了理想的多维数据环境。第一章数据仓库的基本概念数据集市:(DataMart)数据集市是完整的数据仓库的一个逻辑子

8、集,而数据仓库正是由其所有的数据集市有机组合而成的。一般在某个业务部门建立数据集市,或称为部门级数据仓库。建立数据集市与数据仓库,一般是采用“自顶向下”和“自下而上”相结合的设计思想。第一章数据仓库的基本概

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。