商务智能实验7报告

商务智能实验7报告

ID:47727171

大小:1.06 MB

页数:9页

时间:2019-11-05

商务智能实验7报告_第1页
商务智能实验7报告_第2页
商务智能实验7报告_第3页
商务智能实验7报告_第4页
商务智能实验7报告_第5页
资源描述:

《商务智能实验7报告》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、《数据挖掘与商务智能实验》实验报告实验题目:统计分析:逻辑回归姓名:王俊学号:201430850164指导教师:张大斌实验时间:2016.11.092016年11月10日实验题纲:一、实验目的1)了解和熟悉SPSSModeler及其相关知识。2)掌握SPSSModeler工具建立多项Logistic回归的方法。3)学会运用SPSSModeler进行多项Logistic回归的内容。二、实验内容本实验采用的数据源来自文件Brand.sav。该数据集的变量分别是不同性别(x2,1为男,2为女)、三种职业(x1)顾客选购三种品牌(x3)的数据。

2、本实验主要探讨的例子说明多项Logistic回归的操作和意义。三、实验步骤与结果步骤1构建多项式Logistic回归数据流1)通过“Statistic文件”节点读入文件名为Brand.sav的数据。2)数据流中添加“类型”节点。3)在“建模”模块下选择“Logistic”节点连接在数据流的恰当位置。步骤2设置相关参数1)右击“类型”节点,将x3设置为目标,其他保持不变,如图所示。2)右击“Logistic”节点,在模型下,将使用分区数据勾选为“无”,采用的过程选择“多项式”,“多项式过程”中“方法”采用“进入法”,其他保持不变,如图所示

3、。步骤3结果运行本例的计算结果如图所示。结果包含两个回归方程。以第三种职业作为职业的参照水平,以女性作为性别的参照水平,研究对象是选择第一品牌的概率与第三品牌概率之比的自然对数。当性别相同时,第一种职业的比数自然对数比第三种职业(参照水平)平均减少了1.315,第一种职业是第三种职业的0.269倍。第一种职业选择第一品牌的倾向不如第三种职业,且统计显著,第一种职业选择第一品牌的倾向性与第三种职业有显著差异。当职业相同时,男性的比数自然对数比女性(参照水平)平均多0.747个单位,男性是女性的2.112倍。男性较女性更倾向选择第一品牌,且

4、统计表明,男性选择第一品牌的倾向性与女性有显著差异。四、实验分析与扩展练习1.实验分析:请总结分析下面几个问题:(1)结合本次试验数据结果,分析逻辑回归模型的二分类原理;答:原理:(2)当本次实验选择的是第2个方程时,说说方程代表的意义;意义:以第三种职业作为职业的参照水平,以女性作为性别的参照水平,研究对象是选择第一品牌的概率与第三品牌的概率之比的自然对数如图(1)采用二项Logistic回归会出现什么样的结果和问题。出现的问题:2.扩展训练(1)尝试改变挖掘算法的参数,来提高预测的准确率,在“挖掘模型确定性表”中,对挖掘模型进行验证

5、。更改图中所示数据:参数改变如下;左边为改变前,右边为改变后五、结论与讨论(重点)对于逻辑回归的理解:虽然叫做“回归”,但是这个算法是用来解决分类问题的。回归与分类的区别在于:回归所预测的目标量的取值是连续的(例如房屋的价格);而分类所预测的目标变量的取值是离散的(例如判断邮件是否为垃圾邮件)。当然,为了便于理解,从二值分类(binaryclassification)开始,在这类分类问题中,y只能取0或1。更好的理解问题,先举个小例子:假如我们要制作一个垃圾邮件过滤系统,如果一封邮件是垃圾系统,y=1,否则y=0。给定训练样本集,当然它

6、们的特征和label都已知,我们就是要训练一个分类器,将它们分开。1、逻辑回归模型  回归是一种极易理解的模型,就相当于y=f(x),表明自变量x与因变量y的关系。最常见问题有如医生治病时的望、闻、问、切,之后判定病人是否生病或生了什么病,其中的望闻问切就是获取自变量x,即特征数据,判断是否生病就相当于获取因变量y,即预测分类。  最简单的回归是线性回归,有如图1.a所示,X为数据点——肿瘤的大小,Y为观测值——是否是恶性肿瘤。通过构建线性回归模型,如hθ(x)所示,构建线性回归模型后,即可以根据肿瘤大小,预测是否为恶性肿瘤hθ(x)≥

7、.05为恶性,hθ(x)<0.5为良性。图1线性回归示例  然而线性回归的鲁棒性很差,例如在图1.b的数据集上建立回归,因最右边噪点的存在,使回归模型在训练集上表现都很差。这主要是由于线性回归在整个实数域内敏感度一致,而分类范围,需要在[0,1]。逻辑回归就是一种减小预测范围,将预测值限定为[0,1]间的一种回归模型,其回归方程与回归曲线如图2所示。逻辑曲线在z=0时,十分敏感,在z>>0或z<<0处,都不敏感,将预测值限定为(0,1)。图2逻辑方程与逻辑曲线逻辑回归其实仅为在线性回归的基础上,套用了一个逻辑函数,但也就由于这个逻辑函数

8、,逻辑回归成为了机器学习领域一颗耀眼的明星,更是计算广告学的核心。对于多元逻辑回归,可用如下公式似合分类,其中公式(4)的变换,将在逻辑回归模型参数估计时,化简公式带来很多益处,y={0,1}为分类结果。 

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。