《多元回归分析》课件

《多元回归分析》课件

ID:38769840

大小:5.48 MB

页数:57页

时间:2019-06-19

《多元回归分析》课件_第1页
《多元回归分析》课件_第2页
《多元回归分析》课件_第3页
《多元回归分析》课件_第4页
《多元回归分析》课件_第5页
资源描述:

《《多元回归分析》课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第三章多元回归分析§3.1模型的假定§3.2参数的最小二乘估计§3.3最小二乘估计量的性质§3.4多元线性回归模型的统计检验§3.5应用举例3.1多元线性回归模型及其假定回归系数在前面的多元线性回归模型中,称为回归系数。称为偏回归系数(偏效应),它表示在其它自变量保持不变的条件下,该自变量变化一个单位将引起因变量平均变化多少个单位。3.2参数的最小二乘估计拟合值和残差的重要性质(1)残差的样本均值为0;(2)每个自变量和OLS残差之间的样本协方差为0;拟合值与残差之间的样本协方差也为0;(3)点总位于OLS回归线上;3.3最小二乘估计量的性质1、线性性其中,C=(X’

2、X)-1X’为一仅与固定的X有关的行向量2、无偏性这里利用了假设:E(X’)=03、有效性(最小方差性)其中利用了和3.4多元线性回归模型的统计检验则总离差平方和的分解记总离差平方和回归(解释)平方和残差平方和由于=0所以有:注意:一个有趣的现象可决系数该统计量越接近于1,模型的拟合优度越高。调整的可决系数(adjustedcoefficientofdetermination)在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:)1/()/(12---=nTSSkn

3、RSSR其中:n-k为残差平方和的自由度,n-1为总体平方和的自由度。对多个线性约束的F检验不受约束模型(unrestrictedmodel)假设有q个排除性约束,不防设为自变量中的最后q个,虚拟假设为:受约束模型(restrictedmodel)对立假设H1:不正确(即中至少有一个异于0)。定义检验的F统计量式中RSSr为受约束模型的残差平方和,RSSur为不受约束模型的残差平方和。分子中使用的自由度df=被检验的约束个数=dfr-dfur即受约束模型与不受约束模型的自由度之差。分子中使用的自由度df=不受约束模型的自由度=n-k检验不同组之间回归函数(例如k个参数

4、)上差别的邹至庄统计量如下例:在一个F3,60分布中5%的临界值和拒绝域0面积=0.95面积=0.052.76拒绝区域例:考虑如下解释主要俱乐部棒球运动员薪水的模型:式中,salary为1993年的总薪水;years为进入俱乐部的年资;gamesyr为平均每年的比赛次数;bavg为平均职业击球次数;hrunsyr为平均每年的本垒打次数;rbisyr为每年的击球跑垒得分。假设检验的虚拟假设是,一旦控制了俱乐部的年资和每年的比赛次数,度量球员表现的统计指标(bavg、hrunsyr、rbisyr)对薪水没有影响。虚拟假设为采用Wooldridge中MLB1.RAW数据未受

5、约束的模型估计结果为从t检验而言,bavg、hrunsyr、rbisyr中没有一个变量在5%的显著性水平上具有一个统计显著的t统计量,但这并不能表明可以拒绝H0,必须估计受约束模型。受约束模型估计结果为F统计量为显著性水平为5%的临界值为2.60,显著性水平为1%的临界值为3.78,所以在1%的显著性水平拒绝bavg、hrunsyr、rbisyr对薪水没有影响的假设。t统计量由于以cii表示矩阵(X’X)-1主对角线上的第i个元素,于是参数估计量的方差为:其中2为随机误差项的方差,在实际计算时,用它的估计量代替:因此,可构造如下t统计量实际上,其中为xi的总样本变异

6、;为对所有其他自变量(并包括截距项)进行回归所得到的R2t检验设计原假设与备择假设:H1:i0给定显著性水平,可得到临界值t/2(n-k),由样本求出统计量t的数值,通过

7、t

8、t/2(n-k)或

9、t

10、t/2(n-k)来拒绝或接受原假设H0,从而判定对应的解释变量是否应包括在模型中。H0:i=0(i=1,2…k)注意:一元线性回归中,t检验与F检验一致一方面,t检验与F检验都是对相同的原假设H0:1=0进行检验;另一方面,两个统计量之间有如下关系:§3.5应用举例1、中国居民人均消费模型考虑建立中国居民人均消费的多元线性模型。解释变量:人均GDP:G

11、DPP前期消费:CONSP(-1)估计区间:1979~2000年中国居民人均消费支出与人均GDP(元/人)Eviews软件估计结果在中国居民人均收入-消费支出二元模型例中,由应用软件计算出参数的t值:给定显著性水平=0.05,查得相应临界值:t0.025(19)=2.093。可见,计算的所有t值都大于该临界值,所以拒绝原假设。即:包括常数项在内的3个解释变量都在95%的水平下显著,都通过了变量显著性检验。2、企业的工资影响因素模型使用Wooldridge的CEOSAL2.RAW中的数据得到以下关于企业工作人员工资的影响因素模型如下表,小括号内为标准

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。