r语言学习系列32-回归分析

r语言学习系列32-回归分析

ID:22583916

大小:687.04 KB

页数:30页

时间:2018-10-30

r语言学习系列32-回归分析_第1页
r语言学习系列32-回归分析_第2页
r语言学习系列32-回归分析_第3页
r语言学习系列32-回归分析_第4页
r语言学习系列32-回归分析_第5页
资源描述:

《r语言学习系列32-回归分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、27.回归分析回归分析是研究一个或多个变量(因变量)与另一些变量(自变量)之间关系的统计方法。主要思想是用最小二乘法原理拟合因变量与自变量叫的最佳回归模型(得到确定的表达式关系)。其作用是对因变量做解释、控制、或预测。回归与拟合的区别:拟合侧重于调整曲线的参数,使得与数据相符;而回归重在研究两个变量或多个变量之间的关系。它可以用拟合的手法来研究两个变量的关系,以及出现的误差。iHj归分析的步骤:(1)获取自变量和因变量的观测值;(2)绘制散点图,并对异常数据做修正:(3)写出带米知参数的冋归方程;(4)确定回归方程中参数值;(5)假设

2、检验,判断Id归方程的拟合优度;(6)进行解释、控制、或预测。(一)一元线性回归一、原理概述1.一元线性lEj归模型:Y^o+/?lX+8其屮X是自变量,Y是因变量,^,门是待求的未知参数,/?()也称为截距;s是随机误差项,也称为残差,通常要求s满足:①s的均值为0;②e的方差为③协方差COV(8n8j)=0,当i灼时。即对所有的与q互不相关。30o一Tooo543oo21ooo-2oo-3-4o-210o10Io3o2市场收益率用最小二乘法原理,得到最佳拟合效果的A,扁值:^(xz-x)(x-y)2.模型检验(1)拟合优度检验计算

3、R2,反映了自变量所能解释的方差占总方差的百分比,值越大说明模型拟合效果越好。通常可以认为当R2大于0.9时,所得到的回归直线拟合得较好,而当R2小于0.5时,所得到的回归直线很难说明变量之间的依赖关系。(2)回归方程参数的检验回归方程反应了因变量Y随自变量X变化而变化的规律,若久=0,则Y不随X变化,此时回归方程无意义。所以,要做如下假设检验:Ho:Pi=0,Hj:①F检验若&=0为真,则回归平方和RSS与残差平方和ESS/(N-2)都是的无偏估计,因而采用F统计量:RSS/cr2/IESS/a2/(N-2)RSSESS/(N-2)

4、来检验原假设pi=0是否力真。②T检验对Ho:/?#的T检验与F检验是等价的(t2=F)o2.用冋归方程做预测得到回归方程f=戎+3,后,预测X=x0处的Y值丸=戎+扁.丸的预测区间为:(^0-^a/2aM。疔2,夕0+^a/2V^O^2j*5其中ta/2的自由度力N-2.二、R语言实现使用lm()函数实现,基本格式为:lm(formula,data,subset,weights,na.action,method=”qr”,)其中,formula为要拟合的回归模型的形式,一元线性回归的格式为:y〜x,y表示因变量,x表示自变量,若不想

5、包含截距项,使用y〜x-1;data为数掘框或列表;subset选取部分了•集;weights取NULL时表示最小二乘法拟合,若取值为权重向量,则用加权敁小二乘法;na.action设定是否忽略缺失值;method指定拟合的方法,□前只支持“qr”(QR分解),method^“model.frame”返回模型框架。三、实例例1现有埃及卡拉马村庄每只记录儿童身高的数据,做一元线性回归。datas<-data.frame(age=18:29,height=c(76-1,77,78.1,78.2,78-8,79-7,79.9,81.1,81

6、.2,81.8,82.8,83.5))datasageheight11876-121977-032078-142178-252278-862379-772479.982581-192681-2102781-8112882-8122983-5piot(datas)#绘制散点M6OLICM00-§-00_182022242628ageres-reg<-■m(height〜age,datas)嫩一元线性回归summary(res-reg)#输出模型的汇总结果Residuals:Min1QMedian3QMax-0.27238-0.24248

7、-0.027620.160140.47238Coefficients:EstimateStd.ErrortvaluePr(>

8、t

9、)(Intercept)64.92830.5084127.71<2e-16***age0.63500.021429.664.43e-11***Signif.codes:0'***’0.0010.010.050.11Residualstandarderror:0.256on10degreesoffreedomMultipleR-squared:0.9888,AdjustedR-squared:0.9876F-

10、statistic:880on1and10DF,p-value:4.428e-11说明:输出丫残差信息Residuals;回归系数估计值、标准误、t统计量值、p值,可得到回归方程:height=64.9283+0.635

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。