数据仓库2007

数据仓库2007

ID:40229710

大小:2.13 MB

页数:331页

时间:2019-07-27

数据仓库2007_第1页
数据仓库2007_第2页
数据仓库2007_第3页
数据仓库2007_第4页
数据仓库2007_第5页
资源描述:

《数据仓库2007》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、数据仓库和数据挖掘技术信息学院甘岚教学方式与考核方式教学方式本课程以课堂教学为主,以电子教案的内容为主线课外阅读指定的参考文献并利用网上资源,加深对教学内容的理解。考核方式及要求成立课程小组,每组3人选择一个课题进行研究,包括相关论文阅读综述、实验、论文撰写、宣讲论文等内容,小组得分相同。课程论文的格式按照正式发表学术论文的要求,篇幅一般可大于正式发表的论文。期末开卷考试教材与参考书电子教案W.H.Inmon,《数据仓库》第3版,王志海等译,机械工业出版社,2004.08邵峰晶等,《数据挖掘-原理与算法》,中国水利

2、水电出版社,2003.08朱明等,《数据挖掘》,中国科技术大学出版社,2002.05陈京民等,《数据仓库与数据挖掘技术》,电子工业出版社,2002.08康博创作室:《SQLSERVER2000数据仓库设计和使用指南》,清华大学出版社因特网上有关参考资料和文献学术刊物上有关论文第一章引言一、从数据库到数据仓库在市场经济激烈竞争中,企业必须把业务经营同市场联系,在此基础上作出科学、正确的决策以求生存。为此,企业纷纷建立了自己的数据库系统,由计算机管理代替手工操作,以此来收集、存储、管理业务数据,改善办公环境,提高操作人

3、员的工作效率。问题:面向业务操作设计,无论是查询、统计,还是生成报表,其处理方式都是对指定的数据进行简单的数字处理。保险公司:购买人寿保险的客户一般有哪些特征?市场部经理:在过去的一个季度里,咨询哪三样产品的热线电话最多?传统的关系数据库可以回答这种类似问题吗?可以,但是很成问题决策者(比如总经理)希望得到一项分析数据需求提交给公司的信息部门,信息部门指派人员编制程序几天后信息部门的报表送到决策者手中决策者发觉报表不符合要求,提出修改意见交还给信息部门信息部门修改程序,几天后新的报表送给总经理数据来的太慢了,我已经

4、对它不感兴趣了!!传统的关系数据库可以回答这种类似问题吗?可以,但是很成问题决策者(比如总经理)希望得到一项分析数据需求提交给公司的信息部门,信息部门指派人员编制程序几天后信息部门的报表送到决策者手中决策者发觉报表不符合要求,提出修改意见交还给信息部门信息部门修改程序,几天后新的报表送给总经理我辛辛辛苦苦为一个特定问题加班加点干了十天最后被否定了,这已经是第n次了,我辞职不干了!!原因:数据库是针对操作型处理设计的也叫事务处理,是指对数据库的日常联机访问操作,所以也叫联机事务处理(OLTP)。其访问特点是:通常仅仅

5、是对一个或一组记录的查询或修改执行频率高人们关心的是处理的响应时间、数据的安全性和完整性等指标。为完成决策者的询问,信息部门必须:抽取数据抽取程序搜索整个文件或数据库,使用某种标准选择符合限制的数据,并把数据传到其它文件或数据库中。抽取程序很快流行起来并渗透到信息处理环境中,其原因是:1)抽取程序将数据从高性能联机事物处理方式中转移出来,所以在需要总体分析数据时就与联机处理事物能不冲突2)当抽取程序将数据从操作型事物处理范围内移出时,数据的控制方式就发生了转变。最终用户一旦开始控制数据,他最终就拥有了这些数据。DB

6、抽取DBDB……….问题1:蜘蛛网式的拓展问题2:自然演化体系结构的问题1)数据缺乏可信性数据无时基数据算法上的差异抽取的多层次外部数据问题无起始公共数据源2)生产率问题为回答一个决策查询,需要:定位报表所需要的数据并分析数据为报表编辑数据为完成以上工作,召集程序员/分析员,对他们而言:要写的程序很多每个程序必须是定制的程序涵盖了公司拥有的所有技术3)从数据到信息的不可行性在自然演化体系结构中建立起来的系统对信息需求的支持是不充分的,原因是它们缺乏集成性、以及在分析性处理需要的时间上和在蜘蛛网环境中应用程序的可用时

7、间期限上存在差异。数据库方式数据仓库方式80年代以后90年代以后以支持日常业务处理过程为目的(OLTP)以支持经营管理过程中的决策制定为目的(DSS)自进入90年代以后,数据库系统的应用从传统的事务处理应用扩展到辅助决策等新的集成应用领域。数据仓库的出现是为分析型处理用于企业管理人员的决策分析,为制订企业的未来经营管理计划提供辅助决策信息,如决策支持系统(DSS--DecisionSupportSystem)。其访问特点是:需要执行大量的统计操作需要访问大量的历史数据执行频率和对响应时间的要求都不高等。针对工商企业

8、目前业务自动化设计针对工商企业数据分析而设计是在协助工作人员执行既有的活动是在协助工作人员执行管理决策可以让多个用户同时使用信息系统一般而言,同时间不会有太多用户同时使用系统存储的数据比较偏重细节存储的数据偏重较高级别的集合信息数据的来源是用户日常工作的输入数据的来源是OLTP系统数据库的内容会随时被添加、删除,时间短而且占用系统的资源少数据内容是历史数据,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。