spss教程回归分析课件.ppt

spss教程回归分析课件.ppt

ID:57059301

大小:97.00 KB

页数:24页

时间:2020-07-30

spss教程回归分析课件.ppt_第1页
spss教程回归分析课件.ppt_第2页
spss教程回归分析课件.ppt_第3页
spss教程回归分析课件.ppt_第4页
spss教程回归分析课件.ppt_第5页
资源描述:

《spss教程回归分析课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、例1.考虑学生体重(因变量)与身高(自变量、定量变量)的关系时,一般需要把男女学生分开来考虑,因为这一关系很可能因为性别的不同而不同。这些数据储存在SPSS数据文件height.sav中。如果分别考虑男、女生的体重与身高的关系,并假设这一关系为线性的,我们得到(拟合)如下两个简单线性回归方程,括号内为相应系数估计的p-值。女生:w0=-12.446+0.422h0,R2=0.214,(.547)(.002)F=11.165(.002)男生:w1=-37.400+0.645h1,R2=0.434,(.032)(.000)F=42.128(.000)拟合结果表明,男、

2、女生的身高和体重的关系是不同的。问题是:上述身高和体重的关系在不同性别之间的差异显著吗?在上述结果中似乎没有一个合适的量来回答这一问题。在回归模型中引进哑变量(dummyvariable),我们就可以来回答上述问题。哑变量的取值为1和0,用来区分定性变量取某个特定值还是其它值。例1中的变量D就是一个哑变量,哑变量的应用——例1的带有哑变量的回归模型为如下的多元线性回归模型:(变量Dh=D×h)w=b0+b1D+b2h+b3(Dh)+e(1)对于女生,D=0,模型(1)变为w=b0+b2h+e;而男生的模型则为w=(b0+b1)+(b2+b3)h+e。拟合得到如下的

3、回归方程:w=-12.446–24.954D+0.422h+0.223Dh(.534)(.347)(.001)(.166)由拟合结果可以看出,变量D和Dh的系数均不显著。因此可以说,性别对身高和体重关系的影响不显著。但是,由于b0不显著,因此我们需对模型作修改:w=–37.4D+0.346h+0.299Dh(.033)(.000)(.004)此时,变量D和Dh的系数均为显著的。因此我们说,性别对身高和体重关系的影响是显著的。w=–37.4D+0.346h+0.299DhD=0w=0.346hD=1w=–37.4+(0.299+0.346)h男生身高对体重的效应大于

4、女生身高对体重的效应4二项Logistic回归例子在一次住房展销会上,与房地产商签定购房意向书的顾客中,在随后3个月中,只有一部分购买了房屋.购买房屋的顾客记为1,没有购买记为0一、定性因变量的回归方程的意义设因变量y只是取0,1两个值的定性变量,考虑简单线性回归模型:由于,是0—1型贝努利随机变量,则得如下分布根据随机变量的期望值定义,可得二、定性因变量回归的特殊问题1.离散非正态误差项2.零均值异方差性3.回归方程的限制三Logistic回归模型针对0—1型因变量产生的问题,对回归模型应该作两个方面的改进。1.回归函数应该改用限制在区间内的连续曲线,而不能再沿

5、用直线回归方程。2.因变量本身只取0,1两个离散值,不适于直接作为回归模型中的因变量,可以用等于1的比例代替本身作为因变量。Logit变换发生比Logistic回归模型回归系数的含义发生比(相对风险)为当x1增加1个单位时,相对风险的比值基本操作Analyze==》Regression==》BinaryLogisticDependent输入因变量Covariates输入自变量Method:输入自变量筛选策略Enter:强行进入Forward:逐步筛选Backward:向后筛选Select:选择一个变量作为条件变量基本操作Categorical:如果自变量是分类变量

6、生成虚拟变量.CategoricalCovariates:指定分类变量ChangeContrast:选择参照类,最常用为indicator其他操作Option:选择Statisticsandplots:输出统计量和图ClassificatonPlots:绘制因变量实际值与预测分类值的关系图Hosmerlemeshowgoodness-of-fit:输出拟合优度指标Casewiselistingofresiduals:输出各样本数据的非标准化残差,标准化残差Correlationsofestimates:参数估计的相关阵Iterationhistory:最大似然估计

7、的迭代过程CIforexp(B):风险比默认为95%置信区间其他操作Display:显示方法ProbabilityforStepwise:选择逐步回归中自变量进入方程或剔除出方程的显著性水平Classficationcutoff:设置因变量分类分界值MaximumIterations:极大似然估计的最大迭代次数其他操作Save:保存PredictedValues:预测值Probabilities:因变量取1的预测概率值Groupmembership:分类预测值Residuals:残差Influence:COOK距离,杠杆值等实例分析例1:消费行为数据,研究是否购买

8、与性别,年

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。