最新数据挖掘基本概念解说ppt课件.ppt

最新数据挖掘基本概念解说ppt课件.ppt

ID:62137543

大小:863.00 KB

页数:48页

时间:2021-04-18

最新数据挖掘基本概念解说ppt课件.ppt_第1页
最新数据挖掘基本概念解说ppt课件.ppt_第2页
最新数据挖掘基本概念解说ppt课件.ppt_第3页
最新数据挖掘基本概念解说ppt课件.ppt_第4页
最新数据挖掘基本概念解说ppt课件.ppt_第5页
资源描述:

《最新数据挖掘基本概念解说ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、进入夏天,少不了一个热字当头,电扇空调陆续登场,每逢此时,总会想起那一把蒲扇。蒲扇,是记忆中的农村,夏季经常用的一件物品。  记忆中的故乡,每逢进入夏天,集市上最常见的便是蒲扇、凉席,不论男女老少,个个手持一把,忽闪忽闪个不停,嘴里叨叨着“怎么这么热”,于是三五成群,聚在大树下,或站着,或随即坐在石头上,手持那把扇子,边唠嗑边乘凉。孩子们却在周围跑跑跳跳,热得满头大汗,不时听到“强子,别跑了,快来我给你扇扇”。孩子们才不听这一套,跑个没完,直到累气喘吁吁,这才一跑一踮地围过了,这时母亲总是,好似生气的样子,边扇边训,“你看

2、热的,跑什么?”此时这把蒲扇,是那么凉快,那么的温馨幸福,有母亲的味道!  蒲扇是中国传统工艺品,在我国已有三千年多年的历史。取材于棕榈树,制作简单,方便携带,且蒲扇的表面光滑,因而,古人常会在上面作画。古有棕扇、葵扇、蒲扇、蕉扇诸名,实即今日的蒲扇,江浙称之为芭蕉扇。六七十年代,人们最常用的就是这种,似圆非圆,轻巧又便宜的蒲扇。  蒲扇流传至今,我的记忆中,它跨越了半个世纪,也走过了我们的半个人生的轨迹,携带着特有的念想,一年年,一天天,流向长长的时间隧道,袅数据挖掘基本概念解说目录数据挖掘的基本概念1数据挖掘方法分类2

3、CONTENTS数据挖掘案例32数据挖掘技术概论一、数据挖掘的基本概念3数据挖掘技术概论4.数据挖掘基本流程一、数据挖掘的基本概念DataBusinessUnderstandingDataUnderstandingModelingEvaluationDeploymentDataPreparation跨行业数据挖掘标准流程7数据挖掘技术概论4.数据挖掘基本流程一、数据挖掘的基本概念数据采集开始数据分析数据清洗采样特征提取缺失值计算定量特征二值化定性特征编码数据变换无量纲化特征选择降维训练预测评估结束模型选择8数据挖掘技术概论

4、二、数据挖掘的方法分类9数据挖掘技术概论1.几种简单的数据挖掘方法分类(Classification)聚类(Clustering)回归分析(Regressionanalysis)关联规则(Affinitygroupingorassociationrules)复杂数据类型挖掘(Text,Web,图形图像,视频,音频等)二、数据挖掘方法分类10数据挖掘技术概论2.分类(Classification)C4.5(基于决策树改进的算法)CART(分类回归树)SVM(支持向量机)AdaBoost(集成学习算法)kNN(K近邻算法,k-

5、NearestNeighbor)NaiveBayesian(朴素贝叶斯)二、数据挖掘方法分类数据已训练好的模型类别A类别B11数据挖掘技术概论2.分类(Classification)kNN(K近邻算法,k-NearestNeighbor)二、数据挖掘方法分类12数据挖掘技术概论3.聚类(Clustering)(1)划分方法(2)层次的方法(3)基于密度的方法(4)基于网格的方法(5)基于模型的方法经典算法:K-means(K均值)二、数据挖掘方法分类13数据挖掘技术概论4.回归分析(Regressionanalysis)回

6、归分析是一个统计预测模型,用以描述和评估因变量与一个或多个自变量之间的关系,反映的是变量或属性间的依赖关系。线性回归多项式回归逻辑回归二、数据挖掘方法分类X14数据挖掘技术概论5.关联规则(Affinitygroupingorassociationrules)关联规则最初提出的动机是针对购物篮分析(MarketBasketAnalysis)问题提出的。关联规则是形如X→Y的蕴涵式,其中,X和Y分别称为关联规则的先导(antecedent或left-hand-side,LHS)和后继(consequent或right-han

7、d-side,RHS)。其中,关联规则XY,存在支持度和信任度。关联规则中最经典的算法:Apriori算法二、数据挖掘方法分类15数据挖掘技术概论5.关联规则(Affinitygroupingorassociationrules)二、数据挖掘方法分类网球拍网球运动鞋羽毛球111102110031000410105011161100若考虑网球拍->网球的关联关系,则其支持度为S=3/6=0.5,置信度为C=3/5=0.6,假如设计支持度最小为0.5,置信度为0.6,那么网球拍和网球的关联关系就是有意义的一对关联关系。16数据

8、挖掘技术概论二、数据挖掘方法分类5.关联规则(Affinitygroupingorassociationrules)17数据挖掘技术概论三、数据挖掘案例18数据挖掘技术概论三、数据挖掘案例背景银行金融衍生品部门最新新上线了一款金融理财产品,而销售方式为直接电邮,考虑到多数用户可能不会对理财产品感兴趣,所

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。