《数据仓库概述》PPT课件

《数据仓库概述》PPT课件

ID:38901275

大小:1.08 MB

页数:43页

时间:2019-06-21

《数据仓库概述》PPT课件_第1页
《数据仓库概述》PPT课件_第2页
《数据仓库概述》PPT课件_第3页
《数据仓库概述》PPT课件_第4页
《数据仓库概述》PPT课件_第5页
资源描述:

《《数据仓库概述》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数学科学学院-周书锋1第1章数据仓库概述数学科学学院-周书锋2nnn数据仓库基础.段云峰等译.电子工业出版社.2004年4月(DataWarehousingFundamentals.PaulrajPonniah)数据仓库原理与实践.林宇.人民邮电出版社.2003年1月数据仓库与数据挖掘.陈文伟.人民邮电出版社.2004年1月&教材数学科学学院-周书锋3引言:n主要介绍从数据库到数据仓库的演变过程,着重说明“蜘蛛网”问题产生原因以及随之而来的种种问题。为此,必须将操作型环境和分析型环境分离,使企业由以数据库为中心的生产环境过渡到以数据仓库为中心

2、的生产环境。最后简要介绍数据仓库技术的应用前景。数学科学学院-周书锋4内容1.1、数据库到数据仓库的演变1.2、操作型系统和分析型系统的分离1.3、数据仓库定义1.4、数据仓库解决的问题1.5、数据仓库体系结构1.6、数据仓库的运行结构1.7、一个现实的问题1.8、数据仓库应用前景数学科学学院-周书锋51.1数据库到数据仓库的演变n1、蜘蛛网问题n2、蜘蛛网现象n3、蜘蛛网问题特征数学科学学院-周书锋61、蜘蛛网问题n随着数据库技术的广泛应用,企业的运营环境逐渐转化为以数据库为中心。企业对数据的需求是多方面的(企业级、部门级、个人级),这样随

3、着数据逐层提取就会形成一种“蜘蛛网”结构,使数据的访问相当复杂。数学科学学院-周书锋72、蜘蛛网现象部门个人个人部门部门部门企业级数据库部门个人部门个人企业级数据库个人个人个人个人个人个人个人数学科学学院-周书锋83、蜘蛛网问题特征n数据分析的结果缺乏可靠性n电信公司“市场部”和“计划部”对同一业务得出截然相反的结果。n数据处理的效率很低n错综复杂的体系结构中,不同级别的数据库可能使用不同类型的数据库系统。大型:Oracle、DB2;中型:Microsoft SQL Server;小型:Foxpro、MySQL。n难于将数据转化为信息n综合数

4、据处理复杂分析程序1不同部门分析过程的差异企业级数据计划部外部市场信息A外部市场信息B外部市场信息C外部信息分析程序2数学科学学院-周书锋分析结果2:业务A没有场前景9抽取数据的内容不同分析程序和分析内容不同分析结果1:业务A市场前景很好抽取数据的时间不同2001/03/05市场部2001/03/25数学科学学院-周书锋101.2操作型和分析型系统分离n背景:nnnn目前,随着技术的发展和应用需求的不断提高,以及当前的市场形势促使企业必须保持旺盛活力。关键:适时掌握准确信息,利用这些信息作出正确决策。获取和利用信息的方式就是建立覆盖企业所有部

5、门的企业综合信息系统。采用不同技术使得信息必须一致、准确数学科学学院-周书锋11操作型处理和分析型处理n数据处理:nn操作型:以传统的数据库为中心进行企业的日常业务处理。如:电信计费系统,银行系统。分析型(信息型):以数据仓库为中心分析数据背后的关联和规律,为企业的决策提供可靠有效的依据。如:对超市近期数据分析发现畅销商品;对连锁店各个营业点不同时期营业情况的分析。n处理目标:nn操作型:操作员使用,实现企业的业务运营分析型:企业的中高层管理者或从事数据分析的工程师,为企业的决策者提供支持信息。数学科学学院-周书锋12客户数据库计费数据库财务

6、数据库操作型系统面向操作人员,解决业务运营问题,某个数据库只包含企业中的部分信息数据仓库系统面向管理人员,解决决策支持问题,数据仓库中包含企业中整体的宏观信息分析型数学科学学院-周书锋13两种处理的区别分析型数据表示业务处理的静态情况(综合提炼)处理过去历史数据不可更新,只读型用户是综合的提炼的结论性数据操作需求事先并不知道,不知道下一步用户要做什么少数查询访问大量数据对性能要求宽松面向分析,支持管理需求用户需理解数据库得出结论操作型数据表示业务处理的动态情况(细节)存取瞬时数据可更新,由企业录入员录入处理业务细节问题操作需求事先可知,可按预

7、计的工作量进行优化有许多事务,影响局部数据对性能要求高面向应用,支持日常操作用户只输入数据数学科学学院-周书锋以数据库为中心数据库应用B应用C生产环境应用A数据库以数据仓库为中心应用A应用B应用C数据库分析应用A分析应用B分析应用C14生产环境数学科学学院-周书锋151.3数据仓库定义n数据仓库定义:(数据仓库之父W.H.Inmon)nnData Warehouse:是一个面向主题的、集成的、非易失的(稳定的)且随时间变化的数据集合,用来支持管理人员的决策。面向主题:指围绕企业的基本实体设计的;如:城市数据仓库,可考虑人口总数、人均工资水平等

8、。但是,企业业务系统是以优化事务处理的方式来构造数据结构的,对于某个主题的数据常常分布在不同的业务数据库中。16收益数据客户数据市场数据客户服务数据库财务数据库面向

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。