SPSSClementines预测分析模型

(12页)

'SPSSClementines预测分析模型'
SPSS Clementines预测分析模型…??啤酒+尿片故事的实现机理(使用1 1版本实现)SPSS Clenmentines提供众多的预测模型,这使得它们可以应用在多种商业领域中:如超市商品如何摆放可以提高销量;分析商场营销的打折方案,以制定新的更为有效的方案;保险公司分析以往的理赔案例,以推出新的保险品种等等,具有很强的商业价值。超市典型案例如何摆放超市的商品引导消费者购物从而提高销量,这对大型连锁超市来说是一个现实的营销问 题。关联规则模型自它诞生之时为此类问题提供了一种科学的解决方法。该模型利用数据挖掘的 技术,在海量数据中依据该模型的独特算法发现数据内在的规律性联系,进而提供具有洞察力的 分析解决方案。通过一则超市销售商品的案例,利用“关联规则模型”,来分析商品交易流水数 据,以其发现合理的商品摆放规则,来帮助提高销量。关联规则简介关联规则的定义夫朕姒V表示不同数据项目在同一事件中出现的相关性,就是从大量数据中挖掘出关联规则。有 关数据挖掘关联规则的具体理论依据这里不做详细讲解,大家可以参看韩家炜的数据挖掘概论。 为了更直观的理解关联规则,我们首先来看下面的场景。一个市场分析人员经常要考虑这样一个问题:哪些商品是频繁被顾客同时购买的?顾客1:牛奶+面包+谷类顾客2:牛奶+面包+糖+鸡蛋顾客3:牛奶+面包+黄油顾客4:糖+鸡蛋以上的情景类似于当年沃尔玛做的市场调查:啤酒+尿片摆放在同一个货架上,销售业绩激增的 著名关联规则应用。市场分析员分析顾客购买商品的场景,顾客购买面包同时也会购买牛奶的购物模式就可用以下的 关联规则来描述:面包二〉牛奶[支持度二2%,置信度二60%](式1)式7中面包是规则前项(Antecedent),牛奶是规则后项(Consequent) <>实例数(Instances) 表示所有购买记录中包含面包的记录的数量。支持度(Support)表示购买面包的记录数占所有的购买记录数的百分比。规则支持度(Rule Support)表示同时购买面包和牛奶的记录数占所有的购买记录数的百分比。置信度(confidence)表示同时购买面包和牛奶的记录数占购买面包记录数的百分比。 提升(Lift)表示置信度与已知购买牛奶的百分比的比值,提升大于1的规则才是有意义的。 关联规则 式7的支持度2%意味着,所分析的记录中的2%购买了面包。置信度60%表明, 购买面包的顾客中的60%也购买了牛奶。如果关联满足最小支持度阈值和最小置信度阈值,就 说关联规则是有意义的。这些阈值可以由用户或领域专家设定。就顾客购物而言,根据以往的购 买记录,找出满足最小支持度阈值和最小置信度阈值的关联规则,就找到顾客经常同时购买的商 品。此处进行关联规则应用可以使用两种数据格式:1,交易数据格式,2,表格格式。1 ?交易格式ITEMCustomer IDbread jam ju i ce jam mi Ik2.表格格式Customer IDbreadjamjuicemilkFFFFTFFT关联规则挖掘算法Aprior.Carma和序列节点是常用的关联规则挖掘算法,它们都可以使用交易格式和表格格式数 据进行挖掘处理。其中Aprior算法,处理速度快,对包含的规则数没有限制,是一种最有影响 的挖掘关联规则的方法。木次试验将使用SPSS Clementine11 B带的安装目录下的Demos文件夹下的BASKETS 1n数据。希望分析出哪些商品会和啤酒一起购买,以此來合理安排商品的摆放,进而提高啤酒 的销量。此数据属于表格格式数据,每条记录表示顾客的一次购物。记录的字段包括卡号、顾客基本信息、 付款方式和商品名称(每个商品一个字段,该商品字段值为T,表示购买该商品,值为F表 示未购买,具体可参考表2,表格格式数据)。商品名称都有fruitveg (水果蔬菜),fresh meat (牛鲜肉),dairy (奶制品),cannedveg (罐装蔬菜),cannedmeat (罐装肉), fozenmeal (冻肉),beer (啤酒),wine (酒类),softdrink (软饮),fish (鱼),conf ectionery (甜食)。 首先打开Clementine ,会出现一张空白的流界面,这时用户可以在里面创建自C的流。第一步,为流添加一个数据节点,这里选择Clementine自带的Demo数据。将界面下方选项卡 的“数据源”选项中的“可变文件”拖放到空白界面中,双击打开,在文件选项卡中选择Clem entine自带的Demo数据BASKETSIn,如图所示。点击确定按钮,这时就成功的创建了数据节点。第二步,为流添加类型节点,类型芜点是显示和设置数据每个字段的类型、格式和角色。从界面 下方的“字段选项”卡中,将“类型”节点拖放到界面中,接着将数据节点和类型节点连接起来, 或者直接在“字段选项”卡中双击“类型”节点,将两者连接起来。这时双击打开“类型”节点, 此时“类型”节点中显示了数据的字段和其类型,点击“类型”节点界面上的“读取值”按钮, 这时会将数据节点中的数据读取过来。如下图所示。接着可以为参与建模的数据字段设置角色,角色分"输入”,“目标”,“两者”和"无”。畅 人表示该字段可供建模使用,月痂表示该字段为建模的预测目标,两者表示该字段为布尔型的输 入字段,牙表示该字段不参与建模o Apriori节点需要一个或多个输入字段和一个或多个目标字 段,输入字段和输出字段必须是符号型字段。在此可以选择一个或多个字段为目标字段,表明该 模型的预测目标字段;对于Apriori建模节点,也可以不设置目标字段,则需要在建模节点中 设置“后项”。第三步,为流添加过滤节点,将不参与的字段排除在外。该步骤为可选步骤。从“字段选项” 卡中选择“过滤”节点,并将其拖入到界面中,将“过滤”节点加入到流中。双击打开“过滤” 节点,在不参与建模字段的箭头上点击,会出现一个红叉,表示该字段被过滤掉了,不参与建模, 如图所示。XIM II. I匚叵XXft© 駄® «S笛 T1CD <R>H)Y-,8个迂檢入.4个已过童.。个已名.U^eitetCMU 心匕W homoown inconic 咖ft^hm»ae a吗黑第-X-*CM<M rdlut pm^tFiWirxomeftu<Keg(Uirvlraii«) WRAS CH 4X ?6仇 XU??g■仪 mi —a岁<]|K ®*a—LT;8n«/IOM«细 <0)]对于一些与建模关系不大的节点可以将其过滤掉,比如卡号、性别、家乡和年龄字段。第四步,有了这些前期的准备过程,接下来就可以开始创建关联规则模型节点了,在此之前,让 我们先添加一个图形节点——网络节点,建立此节点的目的是为了让用户首先可以直
关 键 词:
SPSSClementines 预测 分析 模型
 天天文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:SPSSClementines预测分析模型
链接地址: https://www.wenku365.com/p-43446096.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服点击这里,给天天文库发消息,QQ:1290478887 - 联系我们

本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有【成交的100%(原创)】。本站是网络服务平台方,若您的权利被侵害,侵权客服QQ:1290478887 欢迎举报。

1290478887@qq.com 2017-2027 https://www.wenku365.com 网站版权所有

粤ICP备19057495号 

收起
展开