R语言学习系列32-回归分析报告

R语言学习系列32-回归分析报告

ID:40026305

大小:447.11 KB

页数:32页

时间:2019-07-17

R语言学习系列32-回归分析报告_第1页
R语言学习系列32-回归分析报告_第2页
R语言学习系列32-回归分析报告_第3页
R语言学习系列32-回归分析报告_第4页
R语言学习系列32-回归分析报告_第5页
资源描述:

《R语言学习系列32-回归分析报告》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、实用文档27.回归分析回归分析是研究一个或多个变量(因变量)与另一些变量(自变量)之间关系的统计方法。主要思想是用最小二乘法原理拟合因变量与自变量间的最佳回归模型(得到确定的表达式关系)。其作用是对因变量做解释、控制、或预测。回归与拟合的区别:拟合侧重于调整曲线的参数,使得与数据相符;而回归重在研究两个变量或多个变量之间的关系。它可以用拟合的手法来研究两个变量的关系,以及出现的误差。回归分析的步骤:(1)获取自变量和因变量的观测值;(2)绘制散点图,并对异常数据做修正;(3)写出带未知参数的回归方程;(4)确定回归方程中参数值;(5

2、)假设检验,判断回归方程的拟合优度;(6)进行解释、控制、或预测。(一)一元线性回归文案大全实用文档一、原理概述1.一元线性回归模型:Y=?0+?1X+ε其中X是自变量,Y是因变量,?0,?1是待求的未知参数,?0也称为截距;ε是随机误差项,也称为残差,通常要求ε满足:①ε的均值为0;②ε的方差为?2;③协方差COV(εi,εj)=0,当i≠j时。即对所有的i≠j,εi与εj互不相关。文案大全实用文档用最小二乘法原理,得到最佳拟合效果的值:,2.模型检验(1)拟合优度检验计算R2,反映了自变量所能解释的方差占总方差的百分比,值越大说

3、明模型拟合效果越好。通常可以认为当R2大于0.9时,所得到的回归直线拟合得较好,而当R2小于0.5时,所得到的回归直线很难说明变量之间的依赖关系。(2)回归方程参数的检验回归方程反应了因变量Y随自变量X变化而变化的规律,若?1=0,则Y不随X变化,此时回归方程无意义。所以,要做如下假设检验:H0:?1=0,H1:?1≠0;①F检验若?1=0为真,则回归平方和RSS与残差平方和ESS/(N-2)都是?2的无偏估计,因而采用F统计量:文案大全实用文档来检验原假设β1=0是否为真。②T检验对H0:?1=0的T检验与F检验是等价的(t2=F

4、)。3.用回归方程做预测得到回归方程后,预测X=x0处的Y值.的预测区间为:其中tα/2的自由度为N-2.二、R语言实现使用lm()函数实现,基本格式为:lm(formula,data,subset,weights,na.action,method="qr",...)其中,formula为要拟合的回归模型的形式,一元线性回归的格式为:y~x,y表示因变量,x表示自变量,若不想包含截距项,使用y~x-1;文案大全实用文档data为数据框或列表;subset选取部分子集;weights取NULL时表示最小二乘法拟合,若取值为权重向量,则

5、用加权最小二乘法;na.action设定是否忽略缺失值;method指定拟合的方法,目前只支持“qr”(QR分解),method=“model.frame”返回模型框架。三、实例例1现有埃及卡拉马村庄每月记录儿童身高的数据,做一元线性回归。datas<-data.frame(age=18:29,height=c(76.1,77,78.1,78.2,78.8,79.7,79.9,81.1,81.2,81.8,82.8,83.5))datasageheight11876.121977.032078.142178.252278.86237

6、9.772479.982581.1文案大全实用文档92681.2102781.8112882.8122983.5plot(datas)#绘制散点图res.reg<-lm(height~age,datas)#做一元线性回归summary(res.reg)#输出模型的汇总结果Residuals:Min1QMedian3QMax-0.27238-0.24248-0.027620.160140.47238Coefficients:EstimateStd.ErrortvaluePr(>

7、t

8、)(Intercept)64.92830.50841

9、27.71<2e-16***age0.63500.021429.664.43e-11***---Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1文案大全实用文档Residualstandarderror:0.256on10degreesoffreedomMultipleR-squared:0.9888,AdjustedR-squared:0.9876F-statistic:880on1and10DF,p-value:4.428e-11说明:输出了残差信息Residuals;回归系数估计

10、值、标准误、t统计量值、p值,可得到回归方程:height=64.9283+0.6350*age回归系数p值(<2e-16,4.43e-11)很小,非常显著的≠0;***也表示显著程度非常显著。拟合优度R2=0.9888>0.5,表示

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。