游戏数据聚类分析TwoS

游戏数据聚类分析TwoS

ID:41132330

大小:681.50 KB

页数:16页

时间:2019-08-17

游戏数据聚类分析TwoS_第1页
游戏数据聚类分析TwoS_第2页
游戏数据聚类分析TwoS_第3页
游戏数据聚类分析TwoS_第4页
游戏数据聚类分析TwoS_第5页
资源描述:

《游戏数据聚类分析TwoS》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、聚类分析理论—TwoStepsTwoSteps算法的优势TwoSteps支持数值型和分类型数据,这对于我们而言在使用时就方便很多,此外游戏数据一般来说都很大,TwoStep在这方面来说还是很具有优势的,数据迭代过程中的内存消耗和聚类数目确定,TwoStep表现的都很好,两步聚类避免了距离矩阵过大,导致算法执行效率下降,而这也是优势所在。数据选取1、这里选取的是次日留存用户数据进行分析,之所以选择次日,是由游戏的特点决定的,再者手机游戏的周期相对短一些,所以如果考虑周,双周就不是很好了(当然也不是绝对的),其实3日留存也可

2、以选择,只是需要了解你自己的游戏具体情况再做判断。2、这里选取的是次日留存用户数据进行分析,之所以选择次日,是由游戏的特点决定的,再者手机游戏的周期相对短一些,所以如果考虑周,双周就不是很好了(当然也不是绝对的),其实3日留存也可以选择,只是需要了解你自己的游戏具体情况再做判断。数据选取既然要做聚类分析,那我们选什么数据作分析,提取特征呢?我们要做的是提取次日留存用户的特征,因此,根据需要我们提取了一些用户的数据点。SPSS进行数据分析打开“菜单

3、分类

4、两步聚类”SPSS进行数据分析要进行变量选择,如果是分类变量,就选择

5、进入分类变量,如果是连续变量,就选择进入连续变量。SPSS进行数据分析距离变量:确定计算两个变量之间的相似性,对数相似值系统使用对数似然距离计算,而欧式距离是以全体变量为连续性变量为前提的,由于我们的数据中存在分类型变量,因此这里选择对数相似值。聚类数量:允许指定如何确定聚类数。如果自动确定将会使用聚类准则中指定的准则[BIC或者AIC],自动确定最佳的聚类数,或者设置最大值。也可以指定一个固定值,不过一般来说就自动确定OK了。连续变量计数:对一个变量是否进行标准化的设置。SPSS进行数据分析点击选项,弹出如下的面板离群

6、值处理:这里主要是针对CF填满后,如何对离群值的处理。关于噪声处理,此处默认即可内存分配:指定聚类算法应使用的最大的内存量。如果该过程超过了此最大值,则将使用磁盘存储内存中放不下的信息。此项默认就行了。连续变量的标准化:聚类算法处理标准化连续变量。点击输出:弹出界面如下两步聚类两步聚类双击这个模型,就会弹出来聚类浏览器两步分类“聚类浏览器”包含两个面板,主视图位于左侧,链接或辅助视图位于右侧。有两个主视图:模型摘要(默认视图)分群。有四个链接/辅助视图:预测变量的重要性.聚类大小(默认视图)单元格分布。聚类比较。结果分析

7、“模型摘要”视图显示聚类模型的快照或摘要,包括加阴影以表示结果较差、尚可或良好的聚类结合和分离的Silhouette测量。该快照可让您快速检查质量是否较差,如果较差,可返回建模节点修改聚类模型设置以生成较好的结果。Thankyou!钓鱼岛游戏中心整理

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。