埃森哲大数据分析方法

埃森哲大数据分析方法

ID:24782197

大小:6.65 MB

页数:65页

时间:2018-11-15

埃森哲大数据分析方法_第1页
埃森哲大数据分析方法_第2页
埃森哲大数据分析方法_第3页
埃森哲大数据分析方法_第4页
埃森哲大数据分析方法_第5页
资源描述:

《埃森哲大数据分析方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、大数据分析--埃森哲2015-7目录概述数据分析框架数据分析方法数据理解&数据准备数据分析支撑工具关联分析聚类分析分类与回归时序模型结构优化数据分析即从数据、信息到知识的过程,数据分析需要数学理论、行业经验以及计算机工具三者结合分析误区数据挖掘工具支撑数学&统计学知识行业经验传统分析机器学习数学&统计学知识数据分析的基础,将整理、描述、预测数据的手段、过程抽象为数学模型的理论知识工具支撑各种厂商开发了数据分析的工具、模块,将分析模型封装,使不了解技术的人也能够快捷的实现数学建模,快速响应分析需求。行业经验行业经验可在数据分析前确定分析需求,分析中检

2、验方法是否合理,以及分析后指导应用,但行业特征不同,其应用也不同,因此本文不展开介绍传统分析在数据量较少时,传统的数据分析已能够发现数据中包含的知识,包括结构分析、杜邦分析等模型,方法成熟,应用广泛,本文不展开介绍分析误区不了解分析模型的数学原理,会导致错误的使用模型,而得出错误的分析结论,影响业务决策,因此在选用分析模型时,要深入了解该模型的原理和使用限制机器学习不需要人过多干预,通过计算机自动学习,发现数据规律,但结论不易控制。数据挖掘数据挖掘是挖掘数据背后隐藏的知识的重要手段随着计算机技术发展和数据分析理论的更新,当前的数据分析逐步成为机器语

3、言、统计知识两个学科的交集(备选)数据挖掘计算机技术统计学、人工智能业务数据数据挖掘就是充分利用了统计学和人工智能技术的应用程序,并把这些高深复杂的技术封装起来,使人们不用自己掌握这些技术也能完成同样的功能,并且更专注于自己所要解决的问题。信息处理信息处理信息处理基于查询,可以发现有用的信息。但是这种查询的回答反映的是直接存放在数据库中的信息。它们不反映复杂的模式,或隐藏在数据库中的规律。传统分析数据分析工具传统分析在数据量较少时,传统的数据分析已能够发现数据中包含的知识,包括结构分析、杜邦分析等模型,方法成熟,应用广泛,本文不展开介绍数据分析工具

4、各种厂商开发了数据分析的工具、模块,将分析模型封装,使不了解技术的人也能够快捷的实现数学建模,快速响应分析需求。随着计算机科学的进步,数据挖掘、商务智能、大数据等概念的出现,数据分析的手段和方法更加丰富一系列以事实为支持,辅助商业决策的技术和方法,曾用名包括专家系统、智能决策等一般由数据仓库、联机分析处理、数据挖掘、数据备份和恢复等部分组成对数据分析的体系化管理,数据分析的主体依然是数据挖掘结构分析分组分析杜邦分析预警分析……常规分析揭示数据之间的静态关系分析过程滞后对数据质量要求高商务智能数据挖掘大数据技术数据可视化统计学和计算机技术等多学科的结

5、合揭示数据之间隐藏的关系将数据分析的范围从“已知”扩展到“未知”,从“过去”推向“将来”从多种类型的数据中,快速获取知识的能力数据挖掘技术的衍生大数据时代,展示数据可以更好辅助理解数据、演绎数据本文在描述数据分析的流程后,重点介绍通用的数据分析方法和主流的应用工具、软件。随着数据量的不断扩大,数据分析理论正处于飞速发展期,因此本文的方法侧重于基础原理介绍。数据分析目录概述数据分析框架数据分析方法数据理解&数据准备数据分析支撑工具关联分析聚类分析分类与回归时序模型结构优化1.业务理解(businessunderstanding)确定目标、明确分析需求

6、2.数据理解(dataunderstanding)收集原始数据、描述数据、探索数据、检验数据质量3.数据准备(datapreparation)选择数据、清洗数据、构造数据、整合数据、格式化数据4.建立模型(modeling)选择建模技术、参数调优、生成测试计划、构建模型5.评估模型(evaluation)对模型进行较为全面的评价,评价结果、重审过程6.部署(deployment)分析结果应用数据分析标准流程CRISP-DM为90年代由SIG组织(当时)提出,已被业界广泛认可的数据分析流程。数据分析框架业务理解数据理解数据准备建立模型理解业务背景,评

7、估分析需求模型评估应用理解业务背景:数据分析的本质是服务于业务需求,如果没有业务理解,缺乏业务指导,会导致分析无法落地。评估业务需求:判断分析需求是否可以转换为数据分析项目,某些需求是不能有效转换为数据分析项目的,比如不符合商业逻辑、数据不足、数据质量极差等。数据收集数据清洗数据收集:抽取的数据必须能够正确反映业务需求,否则分析结论会对业务将造成误导。数据清洗:原始数据中存在数据缺失和坏数据,如果不处理会导致模型失效,因此对数据通过过滤“去噪”从而提取出有效数据数据探索数据转换选择方法、工具,建立模型建模过程评估模型结果评估分析结果应用分析模型改进

8、探索数据:运用统计方法对数据进行探索,发现数据内部规律。数据转换:为了达到模型的输入数据要求,需要对数据进行转换,包括生成

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。