统计前沿-虚假回归

统计前沿-虚假回归

ID:40775896

大小:605.10 KB

页数:20页

时间:2019-08-07

统计前沿-虚假回归_第1页
统计前沿-虚假回归_第2页
统计前沿-虚假回归_第3页
统计前沿-虚假回归_第4页
统计前沿-虚假回归_第5页
资源描述:

《统计前沿-虚假回归》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、虚假回归SpuriousRegression计量经济学在线性回归模型中,我们总是以样本决定系数R2作为回归方程对解释变量与被解释变量样本变化关系的拟合程度的度量。然而变量之间的样本相关与总体相关是两个概念,虽然经济变量的样本之间的关系在一定程度上可以说明变量总体之间的关系,但也有例外,这主要取决于经济变量总体分布的性质。有研究表明,当用两个相互独立的非平稳时间序列建立回归模型时,常常会得到一个在统计意义上显著的回归方程。我们称之为虚假回归(SpuriousRegression)或伪回归。称不相关的随机变量之间的这种统计相关关系为虚假相关。研究虚假回归的第一位学者是

2、尤尔(G.U.Yule),他于1926年研究了虚假回归的问题,但是格兰杰—纽博尔德(C.W.J.Granger–P.Newbold)于1974年首先提出了虚假回归问题。在计量经济应用研究中,我们常常可以看到回归方程的拟合优度极高,即解释变量与被解释变量之间的多重相关系数很高但是DW统计量却极低的例子。比如,作1950年至2003年的美国个人消费支出(Y)关于个人可支配收入(X)的线性回归估计,得:R2=0.997,DW=0.172从DW检验的角度考虑,这样的回归方程不可信,而本章进一步讨论问题的症结所在,即时间序列的非平稳性所至。格兰杰—纽博尔德曾经提出一个较好的

3、经验规则:当R2>DW时,所估计的回归方程就有虚假回归之嫌。为说明虚假回归的可能性,研究者采用反复生成相互独立的时间序列的方法考察其相关系数的变化。分别考察三组时间序列:第一组为两个相互独立的平稳时间序列;第二组为两个相互独立的一阶单整非平稳时间序列;第三组为两个相互独立的二阶单整非平稳时间序列。研究方法为采用蒙特卡罗(MonteCarlo)模拟计算的方法,生成两个相互独立的白噪声随机序列εt、ωt,且εt、ωt为标准正态分布,即E(εt)=E(ωt)=0,Var(εt)=Var(ωt)=1。设样本容量n=100,生成随机序列εt、ωt各10000次,计算每次所生

4、成随机序列εt、ωt的样本相关系数,考察这10000个样本相关系数的分布;对εt、ωt分别进行累加可得两个随机游动序列Xt、Yt,即Xt、Yt为两个I(1)序列,对相应的Xt、Yt的10000个随机样本计算样本相关系数,观察其分布规律;对εt、ωt分别累加两次,即对Xt、Yt分别进行累加得两个I(2)序列Zt、Wt,计算Zt、Wt的样本相关系数,观察其分布规律。三组不同的随机时间序列的样本相关系数研究结果如下:1.两个相互独立的标准正态平稳时间序列的相关系数的分布特征。用蒙特卡罗方法随机生成两个相互独立的标准正态白噪声随机序列εt、ωt,样本容量n=100,各生成

5、10000次。对于随机生成的两个相互独立的正态白噪声随机序列εt、ωt,其样本相关系数R的分布变化如图13-1,显然,这时相关系数R的均值为0,且相关系数为0的概率较大。图13-12.两个相互独立的一阶单整时间序列的相关系数的分布可以证明,由相互独立的正态白噪声εt、ωt累加所生成的两个随机游动序列Xt、Yt为两个相互独立的I(1)序列,其中,序列Xt、Yt的一阶差分为正态白噪声序列。然而用蒙特卡罗方法随机生成10000次的序列Xt、Yt的样本相关系数R的分布如图13-2,类似于半椭圆形,虽然其均值仍为0,但是样本相关系数R为0的概率大大降低。图13-23.两个相

6、互独立的二阶单整时间序列的相关系数的分布。由相互独立的正态白噪声εt、ωt分别累加两次所生成的两个随机序列Zt、Wt为相互独立的I(2)序列,其二阶差分为两个相互独立的正态白噪声序列。但序列Zt、Wt的10000次随机生成的样本的相关系数R的分布如图13-3,这时,两个原本是相互独立的随机变量Zt、Wt的最可能的相关系数R却是±1。而只有当两个时间序列高度相关时才应该出现这种情况图13-3研究表明,作平稳时间序列变量之间的线性回归模型,样本的特性与总体性质是相一致的,而作非平稳时间序列变量之间的线性回归模型,错误地判断解释变量为显著的概率很高。当解释与被解释变量均

7、为I(1)序列时,错误地拒绝解释变量为不显著的原假设β1=0之概率接近76%,即虚假回归的可能性为76%;当两个变量为I(2)时,这一概率竟高达94%以上,有研究证实,这种结果对于两个变量的单整阶数不同的情况也同样成立。由此可见,只要解释变量或被解释变量为非平稳的,虚假回归的可能性就存在。比如在应用经济研究中作中国人口数与美国国民生产总值之间的回归分析,回归估计的拟合优度会很高,此二指标均为I(1)时间序列,显然,中国人口数与美国国民生产总值之间是毫不相干的,这是一个典型的虚假回归之例子。因此,我们在经济分析中不能盲目依赖于R2及t-检验的结果,要正视由变量的非平

8、稳性给我们

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。