数据挖掘clementine决策树实验ppt

数据挖掘clementine决策树实验ppt

ID:9222255

大小:904.30 KB

页数:23页

时间:2018-04-23

数据挖掘clementine决策树实验ppt_第1页
数据挖掘clementine决策树实验ppt_第2页
数据挖掘clementine决策树实验ppt_第3页
数据挖掘clementine决策树实验ppt_第4页
数据挖掘clementine决策树实验ppt_第5页
资源描述:

《数据挖掘clementine决策树实验ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、数据仓库与数据挖掘——第二次实验课助教:周舟邮箱:aaron.d.zhou@gmail.com实验课学习流程�概念回顾�Clementine软件学习(二)�实验流程讲解�实验报告的要求•概念回顾�决策树的概念:什么是决策树(decisiontree)?•概念回顾�决策树的算法:ID3C4.5C5.0(CLEMENTINE)CHAIDCART(分类与回归树)(适用于数据项比较少的决策树算法)•概念回顾�决策树的算法:ID3C4.5C5.0(CLEMENTINE)CHAIDCART(分类与回归树)贪心算法(适用于数据项比较少的决策树算法)•概念回顾�贪心算

2、法:例子:比如中国的货币,有1、2、5、10、20、50、100的面额。如果我要16元,可以拿16个1元,8个2元,但怎样才是合理的组合?假设:某国的钱币分为1元3元4元。如果要拿6元钱怎么拿?贪心算法:先拿4元,再拿两个1元,一共3张钱。实际最优呢?两张3元就够了。1.不能保证求得的最后解是最佳的;2.不能用来求最大或最小解问题;3.只能求满足某些约束条件的可行解的范围。•概念回顾实验目的:用两种不同的决策树算法(C5.0;CART)对超市购物顾客分类。使用软件:Clementine8.1(Clementine12)•Clementine软件学习(二

3、)�实验所需要的节点学习:•Clementine软件学习(二)节点选择栏•Clementine软件学习(二)�变量文件节点:选择导入文件地址选择文件中第一行作为列的标签注释行字符(出现符号下一行为注解)分隔符号选择•Clementine软件学习(二)�类型节点:读入数据告诉建模节点机器在学习过程中字段是否被输入或者输出指定数据字段的检查数据一系列重要属性域值的范围Range:连续Discrete:离散型选择读取当前指定哪些Flag:标记型或改变之前的值视为空Set:集(例:日期)数据白Orderedset:顺序集Typeless:无类型•Clement

4、ine软件学习(二)用户增加的一条记录的字段�导出节点:名被导入属性的类型新属性的类型导出新属性工具编辑器:增加条件判别式•Clementine软件学习(二)�导出节点:�添加判别式,本例子中假设已经导入超市顾客消费信息。利用导出节点导出一个新的属性。这个节点,同时买鱼和酒为真,否则为假•Clementine软件学习(二)�C5.0节点——建立决策树的节点生成决策树或者规则集尝试将所有与输出字段格式相同的字符值合并建立多重模型提高准确性交叉验证指定训练集中噪音或错误数据期望比率•Clementine软件学习(二)�CART(C&RTree)节点根节点最

5、大层数•实验流程讲解�使用超市顾客购物信息,建立一个健康食品购买者的决策树分析。假设同时购买鱼和水果的顾客为健康食品购买者。•实验流程讲解第一步:导入数据•实验流程讲解第二步:查看导入数据信息•实验流程讲解第三步:添加新的属性�增加一个新的属性——health。并设定当同时买水果和鱼的顾客的健康属性为‘T’,否则为‘F’。•实验流程讲解第四步:设定类型节点�设定属性的流入流出方向。•实验流程讲解第五步:添加C5.0节点�增加C5.0决策树节点,并生成决策树,查看结果。•实验流程讲解第六步:增加C&RT节点�增加CART算法决策树,并运行查看结果。•实验

6、报告要求�建立同时购买啤酒和鱼的顾客决策树。(截图+文字)�修改C5.0节点修剪纯度值。观察结果,对剪枝的作用进行分析。�请于5月13日前,把实验报告上传至ftp://202.112.128.79/作业上传/09本科数据挖掘与数据仓库-杜孝平/实验报告2/(相关班级)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。