sas 8.2 enterprise miner数据挖掘实例

sas 8.2 enterprise miner数据挖掘实例

ID:14084849

大小:908.00 KB

页数:34页

时间:2018-07-25

sas 8.2 enterprise miner数据挖掘实例_第1页
sas 8.2 enterprise miner数据挖掘实例_第2页
sas 8.2 enterprise miner数据挖掘实例_第3页
sas 8.2 enterprise miner数据挖掘实例_第4页
sas 8.2 enterprise miner数据挖掘实例_第5页
资源描述:

《sas 8.2 enterprise miner数据挖掘实例》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、SAS8.2EnterpriseMiner数据挖掘实例目录1.SAS8.2EnterpriseMiner简介22.EM工具具体使用说明23.定义商业问题34.创建一个工程44.1调用EM44.2新建一个工程54.3应用工作空间中的节点65.数据挖掘工作流程65.1定义数据源75.2探索数据95.2.1设置Insight节点95.2.2察看Insight节点输出结果105.3准备建模数据125.3.1建立目标变量125.3.2设置目标变量145.3.3数据分割235.3.4替换缺失值235.4建模255.4.1回归模型255.4.2决策树模型265.5评估模型295.

2、6应用模型315.6.1抽取打分程序315.6.2引入原始数据源325.6.3查看结果336.参考文献:351.SAS8.2EnterpriseMiner简介数据挖掘就是对观测到的庞大数据集进行分析,目的是发现未知的关系和以数据拥有者可以理解并对其有价值的新颖方式来总结数据。[1]一个数据挖掘工程需要足够的软件来完成分析工作,为了计划、实现和成功建立一个数据挖掘工程,需要一个集成了所有分析阶段的软件解决方案,包括从数据抽样到分析和建模,最后公布结果信息。大部分专业统计数据分析软件只实现特定的数据挖掘技术,而SAS8.2EnterpriseMiner是一个集成的数据挖

3、掘系统,允许使用和比较不同的技术,同时还集成了复杂的数据库管理软件。SAS8.2EnterpriseMiner把统计分析系统和图形用户界面(GUI)集成在一起,并与SAS协会定义的数据挖掘方法——SEMMA方法,即抽样(Sample)、探索(Explore)、修改(Modify)建模(Model)、评价(Assess)紧密结合,对用户友好、直观、灵活、适用方便,使对统计学无经验的用户也可以理解和使用。EnterpriseMiner简称EM,它的运行方式是通过在一个工作空间(workspace)中按照一定的顺序添加各种可以实现不同功能的节点,然后对不同节点进行相应的设

4、置,最后运行整个工作流程(workflow),便可以得到相应的结果。2.EM工具具体使用说明EM中工具分为七类:nSample类包含InputDataSource、Sampling、DataPartitionnExplore类包含DistributionExplorer、Multiplot、Insight、Association、VariableSelection、LinkAnalysis(Exp.)nModify类包含DataSetAttribute、TransformVariable、FilterOutliers、Replacement、Clustering、S

5、OM/Kohonen、TimeSeries(Exp.)nMedel类包括Regression、Tree、NeuralNetwork、Princomp/Dmneural、UserDefinedModel、Ensemble、Memory-BasedReasoning、TwoStageModelnAssess类包括Assessment、ReporternScoring类包括Score、C*ScorenUtility类包括GroupProcessing、DataMiningDatabase、SASCode、Controlpoint、Subdiagram每个节点的具体使用方法

6、可以在EM打开界面,选择SAS主菜单中帮助子菜单中的“EM参考资料”选项,进一步查看各个节点的具体使用方法。下面我们将以客户商品信息为例来建立如下的工作流程,从而引导我们学会使用EM(EnterpriseMiner)。1.定义商业问题假设有一家目录服务公司每个月都要向发出一份服饰用品和家用器皿的商品目录。为了更好的面对商品战,公司打算发出一张主要宣传厨房用品(dining),包括厨具(kitchenware)、器皿(dishes)和餐具(flatware)的目录。由于对所有的客户发送目录的成本是公司无法承受的,所以公司需要把目标锁定在那些有购买倾向的客户。我们可以通

7、过EM来建立一个倾向模型来完成这个任务,从而得到一个邮寄对象列表。要完成这个任务我们需要准备好关于客户购买产品记录的数据库表,表中应该包含近两年内客户是否购买了厨具(kitchenware)、器皿(dishes)和餐具(flatware)的数据,以及其他与客户购买倾向相关的变量。我们这里根据客户购买的历史数据建立起来了数据集(数据库表)CUSTDET1,它包含了49个变量。上表中的TotalDining(kitch+dish+flat)变量是我们新建的变量,它的值等于KitchenProduct、DishesPurchase和FlatwarePurchase三个

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。