数据仓库和数据挖掘ppt课件.ppt

数据仓库和数据挖掘ppt课件.ppt

ID:50567243

大小:2.12 MB

页数:39页

时间:2020-03-14

数据仓库和数据挖掘ppt课件.ppt_第1页
数据仓库和数据挖掘ppt课件.ppt_第2页
数据仓库和数据挖掘ppt课件.ppt_第3页
数据仓库和数据挖掘ppt课件.ppt_第4页
数据仓库和数据挖掘ppt课件.ppt_第5页
资源描述:

《数据仓库和数据挖掘ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第六章数据仓库和数据挖掘1第六章数据仓库和数据挖掘第一节数据仓库的原理第二节数据仓库体系结构第三节数据仓库的开发第四节联机分析处理OLAP第五节数据挖掘技术第六节数据挖掘的方法和工具2第一节数据仓库的原理一、数据仓库的基本定义1.基本定义数据仓库专家W.H.Inmon的描述:数据仓库是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、随时间不断变化(TimeVariant)的数据集合,用于支持管理决策。3第一节数据仓库的原理一、数据仓库的基本定义Informix公司的负责人定义数据仓库为:数据仓库将分布在企业网

2、络中不同职能部门的业务数据集成,并存储在一个单一的集成关系型数据库中。利用这种集成信息,可方便用户对信息的访问,更可使决策人员对一段时间的历史数据进行分析,研究事物发展走势。4第一节数据仓库的原理2.数据仓库中的一些基本概念①粒度粒度是数据仓库的数据单位中保存数据的细化或综合程度的级别;②分割就是将数据分散到各自的物理单元中去,使它们能被独立地处理;③维是人们观察数据的特定角度,是数据的视图。5第一节数据仓库的原理二、数据仓库的特点①面向主题的②集成的③相对稳定的④随时间变化的6第一节数据仓库的原理①面向主题的数据仓库中的数据是按一定的主题进行组织的,为按主题进行决策的过程提供信

3、息。②集成的数据仓库中数据是来源于分散的数据库数据,它们进入数据仓库中时必须通过一定的方法来使之在数据仓库中有统一的形式和含义。T或F转换T、F是、否0、1(a)集成7第一节数据仓库的原理③相对稳定的也称为非易失性。数据仓库的数据主要供企业决策分析之用,某个数据一旦进入数据仓库,只要它没有数据仓库的数据存储期限,一般就不会被更新。插入删除访问修改数据库抽取、载入时间维数据仓库(b)非易失性8第一节数据仓库的原理④随时间变化的数据仓库随着时间的变化,不断增加新的数据。⑤支持决策系统数据仓库组织的根本目的在于对决策的支持。9第一节数据仓库的原理三、数据仓库中的层次结构一个典型的企业数

4、据仓库系统3层结构:数据获取层、数据存储与管理层、数据访问层10第一节数据仓库的原理①数据获取层对MIS、网管和其他外部数据源中的数据进行抽取、清洗、转换,并加载到数据仓库。②数据存储与管理层实现对数据仓库中数据和源数据的集中存储与管理,进行抽取、清理和有效集成,按照主题进行组织,并可根据需求建立面向部门和主题的部门级数据仓库,或称为数据集市。采用在线分析处理(OnLineAnalysisProcessing,OLAP)服务器技术对数据进行有效集成和组织,以便进行多角度、多层次的分析,并发现趋势。11第一节数据仓库的原理③数据访问层通过多样化的前端分析展示工具(主要包括各种报表工

5、具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具),实现对数据仓库中数据的分析和处理,形成市场经营和决策工作所需要的科学、准确、及时的业务信息和知识。12第一节数据仓库的原理四、数据仓库与数据库的区别13第二节数据仓库体系结构一、数据仓库的体系结构通常包括4个部分:源数据、管理部分、数据仓库和应用部分。14第二节数据仓库体系结构二、数据仓库体系结构中的重要组件1.数据抽取、转换、装载工具ETL(Extract/Transformation/Load)它是把数据从不同的操作型数据库中拿出来,进行必要的转化、整理,再存放到数据仓库内。15第二节数据

6、仓库体系结构2.元数据元数据在数据仓库中的用途有:①起到辅助决策分析过程中定位数据仓库的目录作用②数据从业务环境向数据仓库环境传送时数据仓库的目录内容③指导从近期基本数据到轻度综合数据和到高度综合数据的综合算法选择16第二节数据仓库体系结构3.数据集市(DataMarts)为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据(Subjectdata)4.数据仓库管理工具数据仓库管理工具的主要内容有:安全和特权管理;跟踪数据的更新;数据质量检查;管理和更新元数据;审计和报告数据仓库的使用和状态;删除数据;复制、分割和分发数据;备份和恢复;存储

7、管理17第三节数据仓库的开发一、数据仓库的数据模式1.星式模式一个简单的星式模式(StarSchema)是由一个事实表和多个维表组成。复杂的星式模式包含若干个事实表和维表。18第三节数据仓库的开发2.雪花模式雪花模式(SnowFlakeSchema)是对星式模式的扩展,它的每个维表都可以向外面连接多个维。19第三节数据仓库的开发二、数据仓库的设计方法在设计数据仓库时一般采用的方法有自顶向下方法、自底向上方法、自顶向下和自底向上综合的方法。1.自顶向下方法自顶向下方法是从商业需求出

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。