资源描述:
《岭回归在财政收入中应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、岭回归在财政收入中的应用信息与计算科学2003级母培松指导老师杜世平副教授摘要:本论文介绍了岭回归的统计学原理与方法,阐述了岭回归与最小偏二乘法的差别与关系,总结了评价岭回归的k效应的性质与其确定方法,讨论了岭回归在经济领域中的具体应用,并用matlab软件来实现计算程序。关键词:岭回归,岭迹,病态矩阵,有偏估计RidgeregressionreturnforrevenueMuPeisongInformationandComputationalScience,Grade2003DirectedbyDushiping(AssociateProfessor)Abstract
2、:Thispaperintroducedtheridgeregressionstatisticaltheoryandmethods,Describedthedifferencesandrelationshipsintheridgeregressionandthepartialleasttwomultiplication,RaisedridgeRegressionevaluationofthekeffectofnatureanditsmethod,Moredetaileddiscussionsontheridgeregressionintheeconomicfieldth
3、especificapplication,usingMatlabsoftwaretoachieveprogram.Keywords:RidgeRegression,RidgeTrace,PathologicalMatrix.BiasedEstimate1引言在回归分析中最小二乘法是最常用的方法,使用最小二乘法的一个前提是
4、x,x
5、不为零,即矩阵XX非奇异,当所有变量之间有较强的线性相关性时
6、;rx
7、=o,或者变量之间的数据变化比较小或者部分变量之间有线性相关性吋,矩阵的行列式
8、x,x
9、比较小,M至趋近于o,—般在实际应用中处理:当
10、x*x
11、<0.01时x,x常被称为病态
12、矩阵11-2J,它表明最小二乘法并非在各方面都尽善尽美,因为这种矩阵在计算过程中极易造成约数误差,因此得到的数据往往缺乏稳定性与可靠性。岭回归是在自变量信息矩阵的主对角线元素上人为地加入一个非负因子从而使回归系数的估计稍有偏差、而估计的稳定性却可能明显提高的一种回归分析方法,它是最小二乘法的一种补充,岭回归可以修复病态矩阵,达到较好的效果。近年来,它在经济、工业生产、工程技术、环境保护等方面已有一定的应用。木论文介绍了岭回归的相关理论,以及岭回归与常回归的联系与区别,并结合实际例子阐述岭回归的应用。2岭回归的统计基础2.1岭迹的概念线性回归分析的正规方程组可以写成:XX
13、b=XY(1)其最小平方解则为:b=(xy}xr(2)式(1)与(2)中的X为口变量的心加阶矩阵,X’为X的转置,(XX)为对称的加X/7?方阵,通常xx称为信息矩阵,(xx)t为xx的逆阵,丫为因变量的心1向量,b为待解元,即冋归系数的加xl向量,这里的n为观察值组数,加为待估计的冋归系数。当
14、XX卜0时,矩阵x,x为病态矩阵,这样最小偏二乘法就会产生较大的误差,B是0的无偏估计,但B很不稳定,在具体取值上与真值有较大的偏差,甚至有吋会出现与实际经济意义不符的正负号。如果我们在XX的主对角线元素上加上一个非负因子比,即令:驱)二(XX+灿”厂XV(3)(I,n为血阶
15、单位矩阵),那么b(k)与h有何不同呢(下文在这些统计数后均加标记(k),便于与最小二乘法,即R=0的统计数相区别)?最先研究这一问题的是Hoerl与Kennard以及Marquardt151,他们的基本结论是:b(k)是£的非线性函数;"0时,h(k)=b同为最小平方估计数;而后,随着k的增人,b(灯中各元素勺伙)的绝对值均趋于不断变小(由于自变数间的相关,个别勺伙)可能有小范围的向上波动或改变正、负号),它们对勺的偏差也将愈来愈大;如果Ptoo,则b伙)TO。b伙)随k的改变而变化的轨迹,就称为岭迹,参见图1,岭迹图表明,比的加入使b伙)成为回归系数的有偏估计数。2
16、.2k的效应实际上,k的加入会影响到回归分析中的许多统计数2化而不仅是上述的以灯。其中最重要的还有以下两项:1)随着£的增大,离回归平方与Q仗)=工[5)]2与离冋归均方s2(k)=Q(k)/(n-m-l)都将增大,亦即必有Q⑷>0与2⑴>2,这是随着R增大驱)的偏差也愈来愈大的直接反应L3^9Jo2)随着k的增大,(XX+好)的逆阵、即(XX+好)"的主对角元素s伙)(心1,2,…,加)将不断减小2化亦即必有c,(^)<C,o由于回归系数的误差均方=c,52,所以在k适当可能使q•(小2伙)VC泸2与£认)<£九,即回归系数的误差均方之