数据挖掘原理与spss clementine应用宝典第21章 数据模型

数据挖掘原理与spss clementine应用宝典第21章 数据模型

ID:10389696

大小:3.35 MB

页数:209页

时间:2018-07-06

数据挖掘原理与spss clementine应用宝典第21章 数据模型_第1页
数据挖掘原理与spss clementine应用宝典第21章 数据模型_第2页
数据挖掘原理与spss clementine应用宝典第21章 数据模型_第3页
数据挖掘原理与spss clementine应用宝典第21章 数据模型_第4页
数据挖掘原理与spss clementine应用宝典第21章 数据模型_第5页
资源描述:

《数据挖掘原理与spss clementine应用宝典第21章 数据模型》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘原理与SPSSClementine应用宝典元昌安主编邓 松 李文敬 刘海涛 编著电子工业出版社2本章主要内容建模前的通用设置神经网络C5.0算法生成决策树C&RT基于树的分类预测Kohonen网络模型K-Means聚类分析TwoStep聚类分析异常模型Apriori模型GRI关联规则生成规则集模型序列节点模型主成分/因子分析特征选择模型回归分析Logistic回归模型点击进入相关节内容建模节点选项板包括以下节点:●神经网络●C5.0●C&RT●QUEST●CHAID●Kohonen●K-Means●TwoStep●异常图21-1建模节点选项板●Apriori●GRI●

2、Carma●序列●主成分/因子分析●特征选择●回归●Logistic从图示来辨认一个生成模型的类型图21-2按列序分别为:●神经网络●C5.0●C&RT●CHAID●QUEST●Kohonen●K-Means●特征选择图21-2生成模型选项板●Logistic●回归●TwoStep●主成分/因子分析●未精炼关联规则●Apriori●异常●Carma●规则集21.2建模前的通用设置21.1.1建模节点字段页签所有的建模节点都有一个“字段”页签,用户可以在此指定用于建模的字段。各建模节点的“字段”页签选项稍有区别,如图21-3、21-4所示是神经网络节点的“字段”页签和C&RT节

3、点的“字段”页签。在建模前,需要指定使用哪些字段作为目标字段和输入字段。在默认状态下,除了序列节点,所有的建模节点都从上游的“类型”节点获取字段信息。如果使用“类型”节点选择输入字段和目标字段,无须在这一表上修改任何东西。对于序列检测模型,必须具体设定建模节点字段表上的字段。要了解更详细的内容,请看“21.15.1序列节点字段页签”。建模节点的字段页签选项综合为:图21-3神经网络节点对话框字段页签图21-4C&RT节点对话框字段页签●使用类型节点设置:这一选项告诉节点从上游的“类型”节点获取字段信息。这是默认设置。●使用定制设置:这一选项告诉节点使用本节点指定的字段信息而不

4、是来自上游节点的设置。在选择了该选项后,需要指定以下字段:(1)目标:对于需要至少一个目标字段的模型,选择目标字段。这类似于在“类型”节点中把字段方向设置为“输出”。(2)输入:选择输入字段。这类似于在“类型”节点中把字段方向设置为“输入”。(3)分区:选择分区字段,将会把源数据分区成不同的部分,以方便做测试等。●使用频数字段:这一选项允许用户选择一个字段作为频率权值。如果训练数据集中的每个记录代表不止一个单元——例如使用汇总数据时,就可以选择该选项。字段值是每个记录所代表的单元数。频率字段的值应当是正整数。频率权值会影响C&RT模型分支案例的计算。频率权值为零或者负值的记录

5、将不参与分析。非整数频率权值取整为最相邻的整数。●使用加权字段:这一选项允许选择某一字段作为案例权值。案例权值用于解释输出字段各水平之间的方差。这些权值用于模型估计但是并不影响C&RT模型分支案例的计算。个案权值必须为正,但是可以不是整数。权值为零或者负值的记录将不参与分析。●后项:在关联规则节点(Apriori和GRI)中,选择用作结论规则集中的结果的字段。(这对应于“类型”节点中类型为“输出”或者“两者”的字段)。●前项:在关联规则节点(Apriori和GRI)中,选择用作结论规则集中的前提的字段。(这对应于“类型”节点中类型为“输入”或者“两者”的字段)。●使用事务格式

6、(仅在Apriori节点中出现):Apriori节点既可以处理交易数据格式,也可以处理表格数据格式。交易型数据有两个字段:一个用于存储ID号,一个用于存储交易内容。每个记录代表一项交易,相关交易通过相同的ID号关联起来。●使用表格格式(Apriori节点仅有):表格数据各项分别由二分变量表示,每个记录表示一个完整的交易项。如表21-2所示为一个表格格式的来源实例。21.2.1在数据流中使用生成模型新产生的模型可以放置在数据流中,用于对新数据评估和创建新节点。使用一个生成模型来评估数据,其步骤如下:(1)在生成模型面板中点击选择所需模型。(2)点击流区域中的所需位置以便将模型加

7、入到流中。(3)连接生成模型节点与数据源或转入数据的流。(4)加入或连接一个或多个过程或输出节点(如表节点)到生成模型节点。(5)执行生成模型节点的某个下游节点。使用一个生成模型节点来创建过程节点,其步骤如下:(1)浏览(在选项板上)或编辑(在数据流区域上)这个模型。(2)从这个生成模型浏览器窗口的“生成”菜单中选择所需节点类型。根据不同生成模型节点的类型,有效选项将发生变化。参看特定生成模型类型的细节,用户能够得知从某个特定模型能生成什么。21.2.2使用生成模型浏览器生成模型浏览器允许用户检验和使用

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。