数据仓库课件4

数据仓库课件4

ID:44041478

大小:278.50 KB

页数:36页

时间:2019-10-18

数据仓库课件4_第1页
数据仓库课件4_第2页
数据仓库课件4_第3页
数据仓库课件4_第4页
数据仓库课件4_第5页
资源描述:

《数据仓库课件4》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第2章数据仓库开发模型在创建数据仓库之时,需要使用各种数据模型对数据仓库进行描述。数据仓库的开发人员依据这些数据模型,才能开发出一个满足用户需求的数据仓库。使开发人员能够将注意力集中在数据仓库开发的主要部分。模型有更好的适应性,更易于修改。当用户的需求改变时,仅对模型做出相应的变化就能反映这个改变。2.1数据仓库开发模型模型是对现实世界进行抽象的工具。在信息管理中需要将现实世界的事物及其有关特征转换为信息世界的数据才能对信息进行处理与管理,这就需要依靠数据模型作为这种转换的桥梁。这种转换一般需要经历从现实到概念模型,从概念模型到逻辑模型,从逻辑模型到物理模型的转换

2、过程。现实世界概念世界逻辑世界计算机世界信用特性属性列(字段、数据项)张三个体实体记录客户整体同质总体表文件客户与产品整体间联系异质总体数据库数据仓库的设计就是在概念模型、逻辑模型和物理模型的依次转换过程中实现的。作为数据仓库的灵魂——元数据模型则自始至终伴随着数据仓库的开发、实施与使用。数据粒度和聚集模型也在数据仓库的创建中发挥着指导的作用,指导着数据仓库的具体实现。现实世界概念模型逻辑模型物理模型数据仓库元数据模型数据粒度和聚集模型2.2数据仓库概念模型2.2.1概念数据模型财务部门销售收入账应收账应付账成本账销售部门销售计划销售合同销售统计人事部门员工业绩记

3、录员工技能情况员工薪酬表企业数据模型销售部门人事部门财务部门……………图2.3企业数据模型在构建数据仓库的概念模型时,可以采用在业务处理系统中经常应用的实体-关系模型—E-R图(ERD),这是一种描述组织数据概况的蓝图,在这个蓝图中应该包括整个组织系统中各个部门的业务处理数据及相互关系。尽管在数据仓库的设计过程中可以采用为业务数据处理系统设计所用的数据模型作为设计框架,但是在实际设计中用于数据仓库设计的数据模型与业务数据处理系统的三级数据模型仍有一定的差距。1、数据类型的差距数据仓库的数据模型中不包含操作型的数据,数据仓库的数据模型只包含用户所感兴趣的分析数据、描

4、述数据和细节数据。2、数据的历史变迁性数据仓库的数据模型扩充了关键字结构,增加了时间属性作为关键字的一部分。3、数据的概括性数据仓库的数据模型中还增加了一些由基本数据所导出的衍生数据,这些导出的衍生数据主要用于对企业的管理决策进行分析。指标实体(事实实体)指标实体名维度实体名详细类别实体名维度实体详细类别实体(引用实体)由于用于数据仓库设计的数据模型与业务数据处理系统的三级数据模型有不同点,因些传统的企业数据模型不能直接用于数据仓库的设计。将原ERD中的实体分成指标实体、维度实体和详细类别实体,这样所构造的数据模型才能反映出数据仓库所特有的数据模型特征,而不是与传

5、统数据模型完全雷同的数据模型。利用分类实体所构成的数据模型,可以很直观地观察、理解在数据仓库中的实体以及这些实体之间的关系。2.2.2规范的数据模型数据仓库的数据普通数据库系统的数据长期的框架静态数据通常是汇总的特殊查询访问定期更新数据驱动短期的框架快速变化记录级的访问标准查询访问实时更新事件驱动在为一个联机操作系统创建关系数据库时,我们为实现数据访问的灵活性和高效的数据存储,常常创建一个第三范式的数据模型。数据仓库为了高效地检索数据信息,通常是非规范化的。2.2.3星型模型星型模型是最常用的数据仓库设计结构的实现模式。使数据仓库形成了一个集成系统,为用户提供分析

6、服务对象。事实表维度表维度表维度表维度表维度表核心是事实表,围绕事实表的是维度表。通过事实表将各种不同的维度表连接起来,各个维度表都连接到中央事实表。经济(年收入)100万以上10万以上1万以上1万以下地点国家省市销售销售数量销售价格销售金额时间ID地点ID商品ID年龄60岁以上40岁以上30岁以上20岁以上20岁以下日期年月日商品种类ID小类ID商品ID信用10万元以上1万元以上1千元以上1千元以下0元2.2.4雪花模型雪花模型是对星型模型的扩展,每一个维度都可以向外连接到多个详细类别表。雪花模型对星型模型的维度表进一步标准化,对星型模型中的维度表进行了规范化处

7、理。事实表维度表维度表维度表维度表维度表详细类别表详细类别表经济(年收入)100万以上10万以上1万以上地点国家省市销售销售ID销售数量销售价格销售金额时间ID地点ID商品ID年龄60岁以上40岁以上30岁以上20岁以上20岁以下日期年月日商品ID种类小类商品信用10万元以上1万元以上1千元以上1千元以下0元商品ID生产厂家进货价格进货日期客户客户ID姓名地址电话邮政编码2.3数据仓库的逻辑模型中间层数据模型亦可以称为逻辑模型,它是对高层概念模型的细分,在高层模型中所标识的每个主题域或指标实体都需要与一个逻辑模型相对应。高层概念模型与中层逻辑模型的对应关系如图2.

8、8所示。图

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。