SPSS在数据挖掘中的应用.ppt

SPSS在数据挖掘中的应用.ppt

ID:52621498

大小:1.60 MB

页数:57页

时间:2020-04-11

SPSS在数据挖掘中的应用.ppt_第1页
SPSS在数据挖掘中的应用.ppt_第2页
SPSS在数据挖掘中的应用.ppt_第3页
SPSS在数据挖掘中的应用.ppt_第4页
SPSS在数据挖掘中的应用.ppt_第5页
资源描述:

《SPSS在数据挖掘中的应用.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第16章SPSS在数据挖掘中的应用16.1实例提出:168信息点播业务数据16-1.sav是某月陕西主要地区各类业务的流量数据,数据16-2.sav是该月每天各类业务的流量数据。请利用这些资料分析以下问题:问题一:请分析在168信息点播服务方面陕西各地区(西安、宝鸡、咸阳等)总流量的差别。问题二:请指出该月点播业务最好三项栏目,并分析它们之间的流量有无显著性差异。问题三:请预测该月点播业务最好栏目的长期发展趋势。16.2实例的SPSS软件操作详解问题一操作详解问题一要求分析在168信息点播服务方面陕西各地区(西安、宝鸡、咸阳等)总流量的差别。由于各地区在股票点

2、播、指数点播等业务上的流量数据差异较大,并没有统一的大小顺序关系,因此可以采用聚类分析研究陕西各地区的总流量差异。问题一操作详解Step01:打开数据文件及对话框打开数据文件16-1sav,选择菜单栏中的【Analyze(分析)】→【Classify(分类)】→【HierarchicalCluster(系统聚类)】命令,弹出【HierarchicalClusterClusterAnalysis(系统聚类分析)】对话框。Step02:选择聚类分析变量在左侧的候选变量列表框中选择西安、宝鸡、榆林等十个地区变量设定为聚类分析变量,将其添加至【Variables(变量

3、)】列表框中。同时点选【Variable(变量)】单选钮,表示选择聚类对象为指标变量。Step03:输出聚类数目在主对话框中单击【Statistics】按钮,弹出相应对话框。点选【Singlesolution(单一方案)】单选钮,并在【Numberofclusters(聚类数)】文本框中键入数字“3”表示利用聚类分析将十个地区分为三类。其他选项保持系统默认,单击【Continue】按钮返回主对话框。问题一操作详解Step04:输出聚类图在主对话框中单击【Plots】按钮,弹出【Plots(绘制)】对话框。勾选【Dendrogram(树状图)】复选框,表示输出样

4、品的聚类树形图。其他选项保持系统默认,单击【Continue】按钮返回主对话框。Step05:聚类方法选择在主对话框中单击【Method】按钮,弹出【Method(方法)】对话框。在【TransformValues(转换值)】选项组的【Standardize】下拉菜单中选择【Zscores(Z得分)】标准化方法。其他选项保持系统默认,单击【Continue按】钮返回主对话框。Step06:单击【OK】按钮,完成操作。问题一操作详解问题二操作详解Step01:计算各项业务的日平均流量打开数据文件16-2.sav,选择菜单栏中的【Analyze(分析)】→【Com

5、pareMeans(比较均值)】→【Means(均值)】命令,弹出【Means(均值)】对话框。在左侧的候选变量列表框中选择“股票点播”、“指数点播”等业务。其他选项保持系统默认,单击【OK】按钮完成操作。接着根据输出的业务流量统计数据表16-2.sav,可以确定日平均流量最大的三项业务“股票点播”、“每日运程”和“劲爆笑话”为点播业务最大的业务。问题二操作详解问题二操作详解Step02:业务流量的差异性研究选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【KRela

6、tedSamples(K个相关样本)】命令,弹出【TestsforSevearlRelatedSamples(多个关联样本检验)】对话框。在候选变量列表框中同时选择“股票点播”、“每日运程”和“劲爆笑话”变量作为配对检验变量,将其同时添加至【TestVariable(s)(检验变量)】列表框中。在【TestType(检验类型)】选项组中勾选【Friedman】复选框作为配对样本检验的方法。最后单击主对话框中的【OK】按钮,完成操作。问题二操作详解问题三操作详解Step01:绘制序列图打开数据文件16-2.sav,选择菜单栏中的【Analyze(分析)】→【Fo

7、recasting(预测)】→【SequenceCharts(序列图)】命令,弹出【SequenceCharts(序列图)】对话框。在左侧的候选变量列表框中选择“股票点播”进入右侧的【Variables(变量)】列表框。其他选项保持系统默认,单击【OK】按钮完成操作。根据序列图,观测到股票点播数据虽然平稳,但具有明显的周期性波动特征,因此可以利用ARMA模型来描述点播数据的波动性。问题三操作详解问题三操作详解Step02:时间序列ARMA模型选择菜单栏中的【Analyze(分析)】→【Forecasting(预测)】→【CreateModels(创建模型)】命

8、令,弹出【TimeSeriesMode

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。