数据仓库介绍ppt课件.ppt

数据仓库介绍ppt课件.ppt

ID:58502695

大小:255.50 KB

页数:46页

时间:2020-10-21

数据仓库介绍ppt课件.ppt_第1页
数据仓库介绍ppt课件.ppt_第2页
数据仓库介绍ppt课件.ppt_第3页
数据仓库介绍ppt课件.ppt_第4页
数据仓库介绍ppt课件.ppt_第5页
资源描述:

《数据仓库介绍ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据仓库介绍数据库类型简介商业智能技术数据仓库与多维模型设计数据仓库设计多维模型主题数据库类型(按架构区分)数据库类型间区别数据库 类型特性优点缺点关系型数据库SQLite、Oracle、mysql1、采用了关系模型来组织数据的数据库;2、最大特点就是事务的一致性;3、二维表格模型,由二维表及其之间的联系所组成的一个数据组织。1、容易理解:二维表结构;2、使用方便:通用的SQL语言;3、易于维护:丰富的完整性(实体完整性、参照完整性和用户定义的完整性)大大减低了数据冗余和数据不一致的概率;4、支持SQL,可用于复杂的查询。1、维护一致性所付出的巨大代价就是其读写性

2、能比较差;2、固定的表结构;3、高并发读写需求;4、海量数据的高效率读写;非关系型数据库MongoDb、redis、HBase1、使用键值对存储数据;2、分布式;3、一般不支持ACID特性;4、严格上不是一种数据库,应该是一种数据结构化存储方法的集合。1、无需经过sql层的解析,读写性能很高;2、基于键值对,数据没有耦合性,容易扩展;3、存储数据的格式:nosql的存储格式是key,value形式、文档形式、图片形式等等,文档形式、图片形式等等。1、不提供sql支持,学习和使用成本较高;2、无事务处理,附加功能bi和报表等支持也不好;非关系型数据库分类Exampl

3、es举例典型应用场景数据模型优点缺点键值(key-value)TokyoCabinet/Tyrant,Redis,Voldemort,OracleBDB内容缓存,主要用于处理大量数据的高访问负载,也用于一些日志系统等等。Key指向Value的键值对,通常用hashtable来实现查找速度快数据无结构化,通常只被当作字符串或者二进制数据列存储数据库Cassandra,HBase,Riak分布式的文件系统以列簇式存储,将同一列数据存在一起查找速度快,可扩展性强,更容易进行分布式扩展功能相对局限文档型数据库CouchDB,MongoDbWeb应用(与Key-Value类

4、似,Value是结构化的,不同的是数据库能够了解Value的内容)Key-Value对应的键值对,Value为结构化数据数据结构要求不严格,表结构可变,不需要像关系型数据库一样需要预先定义表结构查询性能不高,而且缺乏统一的查询语法。图形(Graph)数据库Neo4J,InfoGrid,InfiniteGraph社交网络,推荐系统等。专注于构建关系图谱图结构利用图结构相关算法。比如最短路径寻址,N度关系查找等需要对整个图做计算才能得出需要的信息,而且这种结构不太好做分布式的集群方案。数据库使用场景集成(Integrated)数据仓库通常是结合多个异种数据源构成的,异

5、种数据源可能包括关系数据库、面向对象数据库、文本数据库、Web数据库、一般文件等时变(TimeVariant)数据存储从历史的角度提供信息,数据仓库中包含时间元素,它所提供的信息总是与时间相关联的。数掘仓库中存储的是一个时间段的数据,而不仅仅是某一个时刻的数据非易失(Nonvolatile)的数据集合数据仓库总是与操作环境下的实时应用数据物理地分离存放,因此不需要事务处理、恢复和并发控制机制。数据仓库里的数据通常只需要两种操作:初始化载入和数据访问,因此其数据相对稳定,极少或根本不更新。面向主题(SubjectOriented)数据仓库通常围绕一些主题,如“产品”

6、、“销售商”、“消费者”等来进行组织。数据仓库关注的是决策者的数据建模与分析,而不针对日常操作和事务的处理。因此,数据仓库提供了特定主题的简明视图,排除了对于决策无用的数据数据仓库概念(what)数据仓库(DataWarhouse)是一个面向主题、集成、时变、非易失的数据集合,是支持管理部门的决策过程。DW特点1234数据仓库用途(why)传统数据库(事务性)数据数据仓库(决策支持)数据面向应用:数据服务于某个特定的商务过程或功能(OLTP)。面向主题:数据服务于某个特定的商务主题,例如客户信息等。它是非规范化数据(OLAP)。细节数据,例如包含了每笔交易的数据。

7、对源数据进行摘要,或经过复杂的统计计算。例如一个月中交易收入和支出的总和。结构通常不变结构是动态的,可根据需要增减。易变性(数据可改变)非易变(数据一旦插入就不能改变)。事务驱动分析驱动。一般按记录存取,所以每个特定过程只操作少量数据。一般以记录集存取,所以一个过程能处理大批数据,例如从过去几年数据中发现趋势。反映当前情况。反映历史情况。通常只作为一个整体管理。可以分区管理。系统性能至关重要,因为可能有大量用户同时访问。对性能要求较低,同时访问的用户较少。数据仓库设计(how)商业智能的体系商业智能技术体系(BI——BusinessIntelligence)在线分

8、析处理技术

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。