《数据仓库》课件

《数据仓库》课件

ID:38901267

大小:2.35 MB

页数:83页

时间:2019-06-21

《数据仓库》课件_第1页
《数据仓库》课件_第2页
《数据仓库》课件_第3页
《数据仓库》课件_第4页
《数据仓库》课件_第5页
资源描述:

《《数据仓库》课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、DataMining:ConceptsandTechniques—Chapter3—JiaweiHanDepartmentofComputerScienceUniversityofIllinoisatUrbana-Champaignwww.cs.uiuc.edu/~hanj©2006JiaweiHanandMichelineKamber,Allrightsreserved2021/9/41DataMining:ConceptsandTechniques2021/9/42DataMining:ConceptsandTechniques第三章数据仓库与OLAP技术概述什么是数

2、据仓库多维数据模型设计仓库体系结构数据仓库实现从数据仓库到数据挖掘2021/9/43DataMining:ConceptsandTechniques2.2.1数据仓库的产生数据仓库技术是随着人们对大型数据库系统研究的不断深入,在传统数据库技术基础之上发展而来的,其主要目的就是为决策提供支持,为OLAP、数据挖掘深层次的分析提供平台。数据仓库是一个和实际应用密不可分的研究领域,与传统数据库相比,数据仓库不仅引入了许多新的概念,而且在体系结构、数据组织等方面,均有其自身的特点。什么是数据仓库?2021/9/44DataMining:ConceptsandTechniques数

3、据仓库要解决的基本问题全局范围内统一数据视图数据内容数据的完整性数据的准确性数据的一致性数据组织面向分析决策为什么需要数据仓库技术2021/9/45DataMining:ConceptsandTechniques在实际中经常存在这样…为什么需要数据仓库技术2021/9/46DataMining:ConceptsandTechniques“蜘蛛网”问题没有统一规划和设计数据模型不一致数据定义不一致数据准确性差,冗余度高历史数据不统一、不规范解决方案:深入、全面、客观的数据源分析为什么需要数据仓库技术2021/9/47DataMining:ConceptsandTechniq

4、ues传统数据库的主要任务是进行事物处理(OLTP),它所关注的是事物处理的及时性、完整性与正确性,而在数据的分析处理方面,则存在着不足,主要体现在①、集成性的缺乏首先,业务数据库系统的条块与部门分割,导致数据分布的分散化与无序化为什么需要数据仓库技术2021/9/48DataMining:ConceptsandTechniques证券公司内部信息系统上海股东开户系统(指定)数据组织方式关系数据库系统行情分析系统(类型可以选择)数据组织方式加密文本文件上海法人清算系统(指定)数据组织方式关系数据库系统证券交易系统(类型可以选择)数据组织方式关系数据库系统财务分析系统(指定

5、)数据组织方式关系数据库系统证券咨询系统(类型可选择)数据组织方式加密文本文件证券公司内部“信息孤岛群“实例为什么需要数据仓库技术2021/9/49DataMining:ConceptsandTechniques其次,业务数据库缺乏统一的定义与规划,导致数据定义存在歧义证券交易数据库客户信息表acc-_numchar(10)CRM数据库客户信息表acc-_numchar(10)字段定义相同,但含义不同为什么需要数据仓库技术2021/9/410DataMining:ConceptsandTechniques上交所行情数据库S1char(6)深交所行情数据库hqzychar(

6、6)字段名称不同,但含义相同为什么需要数据仓库技术2021/9/411DataMining:ConceptsandTechniques②.主题不明确建立传统数据库的目的是为了满足事物处理的需求,库和表的定义完全以此为基础进行,对数据分析而言缺少明确的主题。③、分析处理效率低为什么需要数据仓库技术2021/9/412DataMining:ConceptsandTechniques进一步整合现有的数据企业范围内的信息共享准确、一致的集成数据快速访问精确、灵活分析解决方案:引入数据仓库、联机分析处理和数据挖掘等技术为什么需要数据仓库技术2021/9/413DataMining:

7、ConceptsandTechniques数据仓库的定义数据仓库之父BillInmon在1991年出版的“BuildingtheDataWarehouse”(《建立数据仓库》)数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策和信息的全局共享。什么是数据仓库2021/9/414DataMining:ConceptsandTechniques注意:数据仓

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。