SPSS学习系列27. 回归分析

SPSS学习系列27. 回归分析

ID:42269562

大小:759.08 KB

页数:23页

时间:2019-09-11

SPSS学习系列27. 回归分析_第1页
SPSS学习系列27. 回归分析_第2页
SPSS学习系列27. 回归分析_第3页
SPSS学习系列27. 回归分析_第4页
SPSS学习系列27. 回归分析_第5页
资源描述:

《SPSS学习系列27. 回归分析》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、27.回归分析回归分析是研究一个或多个变量(因变量)与另一些变量(自变量)之间关系的统计方法。主要思想是用最小二乘法原理拟合因变量与自变量间的最佳回归模型(得到确定的表达式关系)。其作用是对因变量做解释、控制、或预测。回归与拟合的区别:拟合侧重于调整曲线的参数,使得与数据相符;而回归重在研究两个变量或多个变量之间的关系。它可以用拟合的手法来研究两个变量的关系,以及出现的误差。回归分析的步骤:(1)获取自变量和因变量的观测值;(2)绘制散点图,并对异常数据做修正;(3)写出带未知参数的回归方程;(4)确定回归方程中参数值;(5)假设检验,判断回归方程的

2、拟合优度;(6)进行解释、控制、或预测。(一)一元线性回归一、基本原理一元线性回归模型:Y=?0+?1X+ε其中X是自变量,Y是因变量,?0,?1是待求的未知参数,?0也称为截距;ε是随机误差项,也称为残差,通常要求ε满足:①ε的均值为0;②ε的方差为?2;③协方差COV(εi,εj)=0,当i≠j时。即对所有的i≠j,εi与εj互不相关。二、用最小二乘法原理,得到最佳拟合效果的值:,三、假设检验1.拟合优度检验计算R2,反映了自变量所能解释的方差占总方差的百分比,值越大说明模型拟合效果越好。通常可以认为当R2大于0.9时,所得到的回归直线拟合得较好

3、,而当R2小于0.5时,所得到的回归直线很难说明变量之间的依赖关系。2.回归方程参数的检验回归方程反应了因变量Y随自变量X变化而变化的规律,若?1=0,则Y不随X变化,此时回归方程无意义。所以,要做如下假设检验:H0:?1=0,H1:?1≠0;(1)F检验若?1=0为真,则回归平方和RSS与残差平方和ESS/(N-2)都是?2的无偏估计,因而采用F统计量:来检验原假设β1=0是否为真。(2)T检验对H0:?1=0的T检验与F检验是等价的(t2=F)。3.用回归方程做预测得到回归方程后,预测X=x0处的Y值.的预测区间为:其中tα/2的自由度为N-2.

4、二、实例例1有30名儿童棒球选手的数据:变量Height表示“击球高度”,Distance表示“球飞出的距离”,用回归分析研究球飞出的距离与击球高度的关系。1.【分析】——【回归】——【线性】,打开“线性回归”窗口,将变量“Distance”选入【因变量】框,“Height”选入【自变量】框;注:【选择变量+规则】:可以对某个变量,只对满足某条件的个案做回归分析;【WLS权重】:可选择加权变量进行加权最小二乘法的回归分析;2.点【统计量】,打开“统计量”子窗口,勾选【回归系数】下的“估计”、“置信区间”,勾选【残差】下的“Durbin-Watson”

5、,勾选“模型拟合度”、“描述性”;点【继续】;3.【保存】可选项点【保存】,打开“保存”子窗口,【预测值】给出用回归方程计算的预测值;勾选“未标准化”,【残差】给出做残差分析模型诊断用的各种残差,勾选“标准化”;将在原数据上增加两列PRE_1和ZRE_1分别存储预测值和残差值;点【继续】;点【确定】,得到描述性统计量均值标准偏差N球飞出的距离130.7311.19430击球高度48.972.37130相关性球飞出的距离击球高度Pearson相关性球飞出的距离1.000.613击球高度.6131.000Sig.(单侧)球飞出的距离..000击球高度.0

6、00.N球飞出的距离3030击球高度3030给出了两个变量的相关性描述,相关系数为0.613.输入/移去的变量a模型输入的变量移去的变量方法1击球高度b.输入a.因变量:球飞出的距离b.已输入所有请求的变量。选入回归模型的变量以及剔除的变量,本例只有一个自变量。模型汇总b模型RR方调整R方标准估计的误差Durbin-Watson1.613a.376.3539.0011.569a.预测变量:(常量),击球高度。b.因变量:球飞出的距离模型的R2反映了自变量所能解释的方差占总方差的百分比,值越大说明模型拟合效果越好,本例R2=0.376,说明线性回归关系

7、并不强,球飞出的距离可能还和其它因素如选手的年龄、经验有关。Durbin-Watson检验值=1.569,说明残差基本上是独立的(靠近2说明误差基本上是独立的,小于2说明是正相关。Anovaa模型平方和df均方FSig.1回归1365.50811365.50816.855.000b残差2268.3582881.013总计3633.86729a.因变量:球飞出的距离b.预测变量:(常量),击球高度。回归模型的F检验,原假设H0:回归系数=0;本例P值<0.001<0.05,故拒绝原假设H0,即回归系数不为0.注:对一元线性回归模型,由于T值=F值的平方

8、根,故T检验与F检验是等价的。系数a模型非标准化系数标准系数tSig.B的95.0%置信区间B标准误差试用版

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。