SPSS学习系列27. 回归分析

(24页)

'SPSS学习系列27. 回归分析'
27. 回归分析回归分析是研究一个或多个变量(因变量)与另一些变量(自变量)之间关系的统计方法。主要思想是用最小二乘法原理拟合因变量与自变量间的最佳回归模型(得到确定的表达式关系)。其作用是对因变量做解释、控制、或预测。回归与拟合的区别:拟合侧重于调整曲线的参数,使得与数据相符;而回归重在研究两个变量或多个变量之间的关系。它可以用拟合的手法来研究两个变量的关系,以及出现的误差。 回归分析的步骤: (1)获取自变量和因变量的观测值;(2)绘制散点图,并对异常数据做修正;(3)写出带未知参数的回归方程;(4)确定回归方程中参数值;(5)假设检验,判断回归方程的拟合优度;(6)进行解释、控制、或预测。(一)一元线性回归一、基本原理 一元线性回归模型: Y=?0+?1X+ε其中 X是自变量,Y是因变量,?0,?1是待求的未知参数,?0也称为截距;ε是随机误差项,也称为残差,通常要求ε满足:① ε的均值为0;② ε的方差为?2;③ 协方差COV(εi, εj)=0,当i≠j时。即对所有的i≠j, εi与εj 互不相关。二、用最小二乘法原理,得到最佳拟合效果的值:, 三、假设检验1. 拟合优度检验计算R2,反映了自变量所能解释的方差占总方差的百分比,值越大说明模型拟合效果越好。通常可以认为当R2大于0.9时,所得到的回归直线拟合得较好,而当R2小于0.5时,所得到的回归直线很难说明变量之间的依赖关系。2. 回归方程参数的检验回归方程反应了因变量Y随自变量X变化而变化的规律,若?1=0,则Y不随X变化,此时回归方程无意义。所以,要做如下假设检验:H0: ?1=0, H1: ?1≠0; (1) F检验 若?1=0为真,则回归平方和RSS与残差平方和ESS/(N-2)都是?2的无偏估计,因而采用F统计量:来检验原假设β1=0是否为真。(2)T检验对H0: ?1=0的T检验与F检验是等价的(t2=F)。3. 用回归方程做预测得到回归方程后,预测X=x0处的Y值.的预测区间为:其中tα/2的自由度为N-2. 二、实例例1 有30名儿童棒球选手的数据:变量Height表示“击球高度”,Distance表示“球飞出的距离”,用回归分析研究球飞出的距离与击球高度的关系。 1. 【分析】——【回归】——【线性】,打开“线性回归”窗口,将变量“Distance”选入【因变量】框,“Height”选入【自变量】框;注:【选择变量+规则】:可以对某个变量,只对满足某条件的个案做回归分析;【WLS权重】:可选择加权变量进行加权最小二乘法的回归分析;2. 点【统计量】,打开“统计量”子窗口,勾选【回归系数】下的“估计”、“置信区间”,勾选【残差】下的“Durbin-Watson”,勾选“模型拟合度”、“描述性”;点【继续】;3. 【保存】可选项点【保存】,打开“保存”子窗口,【预测值】给出用回归方程计算的预测值;勾选“未标准化”,【残差】给出做残差分析模型诊断用的各种残差,勾选“标准化”;将在原数据上增加两列PRE_1和ZRE_1分别存储预测值和残差值;点【继续】;点【确定】,得到描述性统计量均值标准 偏差N球飞出的距离130.7311.19430击球高度48.972.37130相关性球飞出的距离击球高度Pearson 相关性球飞出的距离1.000.613击球高度.6131.000Sig. (单侧)球飞出的距离..000击球高度.000.N球飞出的距离3030击球高度3030 给出了两个变量的相关性描述,相关系数为0.613. 输入/移去的变量a模型输入的变量移去的变量方法1击球高度b.输入a. 因变量: 球飞出的距离b. 已输入所有请求的变量。选入回归模型的变量以及剔除的变量,本例只有一个自变量。模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.613a.376.3539.0011.569a. 预测变量: (常量), 击球高度。b. 因变量: 球飞出的距离模型的R2反映了自变量所能解释的方差占总方差的百分比,值越大说明模型拟合效果越好,本例R2=0.376,说明线性回归关系并不强,球飞出的距离可能还和其它因素如选手的年龄、经验有关。Durbin-Watson 检验值=1.569,说明残差基本上是独立的(靠近2说明误差基本上是独立的,小于2说明是正相关。Anovaa模型平方和df均方FSig.1回归1365.50811365.50816.855.000b残差2268.3582881.013总计3633.86729a. 因变量: 球飞出的距离b. 预测变量: (常量), 击球高度。回归模型的F检验,原假设H0:回归系数=0;本例P值<0.001<0.05, 故拒绝原假设H0, 即回归系数不为0. 注:对一元线性回归模型,由于T值=F值的平方根,故T检验与F检验是等价的。系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准 误差试用版下限上限1(常量)-11.00934.564-.319.752-81.80959.792击球高度2.895.705.6134.106.0001.4504.339a. 因变量: 球飞出的距离给出回归方程的常数项、回归系数的估计值及置信区间,以及检验结果(原假设H0:其值=0),得到回归方程:Distance = -11.009 + 2.895 * Height斜率2.895的t检验P值=0.0003<0.05,说明该结果在显著水平α下有统计学意义;但截距的t检验结果并不显著。残差统计量a极小值极大值均值标准 偏差N预测值119.25142.41130.736.86230残差-23.72420.276.0008.84430标准 预测值-1.6731.701.0001.00030标准 残差-2.6362.253.000.98330a. 因变量: 球飞出的距离(二)多元线性回归一、基本原理 多元线性回归模型:Y=?0+?1X1+…+ ?NXN+ε其中 X1
关 键 词:
SPSS学习系列27.回归分析
 天天文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:SPSS学习系列27. 回归分析
链接地址: https://www.wenku365.com/p-42269562.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服点击这里,给天天文库发消息,QQ:1290478887 - 联系我们

本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有【成交的100%(原创)】。本站是网络服务平台方,若您的权利被侵害,侵权客服QQ:1290478887 欢迎举报。

1290478887@qq.com 2017-2027 https://www.wenku365.com 网站版权所有

粤ICP备19057495号 

收起
展开