数据挖掘软件及ods

数据挖掘软件及ods

ID:34597224

大小:41.17 KB

页数:4页

时间:2019-03-08

数据挖掘软件及ods_第1页
数据挖掘软件及ods_第2页
数据挖掘软件及ods_第3页
数据挖掘软件及ods_第4页
资源描述:

《数据挖掘软件及ods》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、五个免费开源的数据挖掘软件/什么是ODS?信息处理的多层次要求导致了一种新的数据环境——DB-DW的中间层ODS(操作型数据存储)的出现。ODS是“面向主题的、集成的、当前或接近当前的、不断变化的”数据。通过统一规划,规范框架和数据,ODS可以实现操作型数据整合和各个系统之间的数据交换,能够提供实时的操作型报表,减轻数据仓库的负担。建设ODS还可以为后期数据仓库建设做好准备。什么是ODS?ODS全称为OperationalDataStore,即操作型数据存储,是“面向主题的、集成的、可变的、反映当前数据值的和详细的数据的集合,用

2、来满足企业综合的、集成的以及操作型的处理需求”(Bill.Inmon)。ODS是数据仓库体系结构中的一个可选部分,ODS具备数据仓库的部分特征和OLTP系统的部分特征。1.1ODS的出现系统应用集成中一般对各系统中数据分为两类:操作型数据,有细节化,分散化的特点;决策型数据,有综合化,集成化的特点。    数据仓库概念的提出也把数据处理划分为了操作型处理和分析型处理两种不同类型,从而建立起了DB-DW的两层体系结构。但是有很多情况,DB-DW的两层体系结构并不能涵盖企业所有的数据处理要求,比如有些实时性决策问题,它要求获取数据周

3、期不能太长,而且也需要一定程度的汇总。信息处理的多层次要求导致了一种新的数据环境——DB-DW的中间层ODS(操作型数据存储)的出现。它像DW一样是一种面向主题,集成的数据环境,又像操作型DB一样包含着全局一致的、细节的当前的数据。这样就构成了DB-ODS-DW的关于企业数据的三层体系结构。1.2与应用系统、数据仓库的比较    根据数据仓库之父Bill.Inmon的定义,“数据仓库是面向主题的、集成的、稳定的、随时间变化的,主要用于决策支持的数据库系统”。下面对数据仓库、ODS和数据库进行多方面的比较:比较项目数据仓库ODS应

4、用系统建设目的决策支持实时监控业务操作服务对象企业管理层业务管理层生产层存储周期长期短期即时处理频率非实时准实时实时主要功能分析功能事务处理,短时分析事务处理技术实现OLAPOLAP、OLTPOLTP功能结构集中相对集中分散数据类型明细数据,汇总数据明细数据明细数据数据容量非常大小小1.3应用集成方案比较实施方案实施结果优势缺陷数据仓库(DW)企业能够分析DW中的历史数据,进行中远期的规划可以解决企业的决策需求不能满足企业的实时监控和实时业务需求操作型数据存储(ODS)企业能够把握ODS中的当前综合数据,对企业的及时运行情况随时

5、掌控可以满足企业的实时监控和实时业务需求不能满足企业的中远期决策需求DW+ODS企业能够分析ODS中的当前综合数据,对企业当前运行情况进行宏观控制;能够分析DW中的历史数据,对未来进行合理规划ODS技术的引入和应用,为企业在日常经营中进行即时OLAP提供了一种解决方案,使得企业无须建立一个“臃肿”的DW,就可以进行一些非战略性的中层决策,来实现对企业的日常管理和控制,同时也能获得较快的响应速度。Orange  Orange是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏

6、览数据分析和可视化,基绑定了Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。其由C++和Python开发,它的图形库是由跨平台的Qt框架开发。  RapidMiner  RapidMiner,以前叫YALE(YetAnotherLearningEnvironment),其是一个给机器学习和数据挖掘和分析的试验环境,同时用于研究了真实世界数据挖掘。  它提供的实验由大量的算子组成,而这些算子由详细的XML文件记录,并被RapidMiner图形化的用户接口表

7、现出来。RapidMiner为主要的机器学习过程提供了超过500算子,并且,其结合了学习方案和Weka学习环境的属性评估器。它是一个独立的工具可以用来做数据分析,同样也是一个数据挖掘引擎可以用来集成到你的产品中。  Weka  由Java开发的Weka(WaikatoEnvironmentforKnowledgeAnalysis)是一个知名机器学机软件,其支持几种经典的数据挖掘任务,显著的数据预处理,集群,分类,回归,虚拟化,以及功能选择。  其技术基于假设数据是以一种单个文件或关联的,在那里,每个数据点都被许多属性标注。Wek

8、a使用Java的数据库链接能力可以访问SQL数据库,并可以处理一个数据库的查询结果。它主要的用户接品是Explorer,也同样支持相同功能的命令行,或是一种基于组件的知识流接口。  JHepWork  为科学家,工程师和学生所设计的jHepWork是一个免费的开

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。