线性回归ppt课件.ppt

线性回归ppt课件.ppt

ID:59766658

大小:701.00 KB

页数:32页

时间:2020-11-23

线性回归ppt课件.ppt_第1页
线性回归ppt课件.ppt_第2页
线性回归ppt课件.ppt_第3页
线性回归ppt课件.ppt_第4页
线性回归ppt课件.ppt_第5页
资源描述:

《线性回归ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、线性回归分析第一节一元线性回归模型第二节多元线性回归模型第三节回归方程统计检验第四节多重共线性问题第五节虚拟变量的应用第六节统计软件在线性回归分析中的应用第一节一元线性回归模型一元线性回归模型的由来:假设在总体中满足Y=A+BX+ε,Y为随机变量,X为确定变量;将随机样本的观测数据代入方程中,则有:yi=a+bxi+ei,ei为样本随机误差项。y’=a+bx。参数a、b用最小平方法(OrdinaryLeastSquares)求得,即所有观测值与估计值之间的误差平方和最小。一元线性回归模型y’=a+bx的作用:简化

2、x、y之间的关系,以直线作为简化方式;用x来预测y的变化,以直线作为预测的准则;研究x在多大程度上解释y的变化。一元线性回归系数一元回归系数的含义:a是直线在y轴上的截距,代表y的基础水平;b是直线的斜率,代表x变化一个单位时,y的平均变化;变量变换:由于直线关系是最简单的(叠加)关系,所以,尽量用直线作为预测或估计的准则;当因变量y与自变量x是非线性关系时,可以通过变量变换使经过变换的新变量对于参数是线性的。关于最小平方法一元线性回归模型的估计方法:最小平方法;最小平方法的统计性质:回归方程的拟合误差总和等于0

3、,即Σei=0;误差平方和最小,即在所有拟合散点的直线中,根据最小平方法原则得到的回归直线使n个散点(yi,xi)沿y轴方向到直线的距离平方和最小;y’的平均值等于y的平均值;x与e相互独立,即x与e的协方差等于0,Cov(x,e)=[Σ(xi-x)(ei)]/n=0;y’与e相互独立,即y’与e的协方差等于0;直线通过n个散点的重心点,即x与y的均值确定的点一元线性回归模型的假设模型的假设条件(assumption)。统计理论已经证明,在满足一定的假设条件下,样本数据的最小平方估计是总体参数的最佳线性无偏估计。

4、在推断总体参数或进行统计检验时,必须考虑总体回归模型中的随机误差项ε的分布特征。对总体随机误差ε的假设:高斯假设:零均值性;等方差性;误差之间独立;误差项与自变量相互独立;误差的正态分布性;违反假设可能产生的影响。第二节多元线性回归模型含义和作用分析一个随机变量与多个变量之间线性关系的最常用的统计方法。它用变量的观察数据拟合所关注的变量,并以线性关系式表达所关注的变量,并且回答这种表达的解释程度有多高;检验影响变量的显著程度和比较它们的作用大小,进而用两个或多个变量的变化解释和预测另一个变量的变化。因变量(dep

5、endentvariable)和自变量(independentvariable)的确定是建立回归模型的主要任务。回归方程的系数回归系数的意义:b0,b1,b2,…bk称为回归平面的系数。bj,j=1,2,…k表示其他变量xi在i=1,2,…,k固定时,xj每变化一个单位,y的平均变化。无论其他变量在什么水平上,只要其他变量固定,那么,xj的变化对y的影响都是相等的;至于y的取值,则与各个变量的当前水平有关。标准化回归系数定义:若先将所有的自变量和因变量进行标准化处理(均值为0,标准差为1),然后进行回归得到标准化

6、回归方程,该方程的系数称为标准化回归系数。作用每一个标准化系数都表示,当其他变量不变时,xj变化一个标准差单位,y的标准差的平均变化。表示的是方程内变量之间的相对重要性;通过绝对值的比较,可回答在诸多解释变量中,哪个变量更重要的问题。方程的解释能力及其测量方程的确定能力:所得回归方程在多大程度上解释了因变量的变化,或者说方程对观察值的拟合程度如何;确定系数(coefficientofdetermination)R2:R2=Σ(y’-y均值)2/Σ(y-y均值)2,其值越接近1,表明方程中的变量对y的解释能力越强。

7、它是方程拟合优度的度量,R2越大说明回归方程拟合优度越好,自变量与因变量线性关系越强,即回归方程中的自变量对y的解释能力越强。R2越小说明自变量与因变量的线性关系越弱,它们之间的独立性越强,或者说对x的了解无助于对y的预测。方程解释能力的其他测量调整的确定系数:R2adj=1-(n-1)(1-R2)/(n-k-1):R2是受自变量个数与样本规模之比(k:n)影响的系数,一般常规是1:10以上为好。当这个比值小于1:5时,R2倾向于高估实际的拟合优度,为了避免这种情况,采用R2adj代替R2。多元相关系数R(mul

8、tiplecorrelation):对R2开方就得到R,R越接近1,表明y与所有x之间的线性关系越密切;实际上,R是y观测值与y预测值之间的简单相关系数。方程解释能力的其他测量净确定系数(partialcoefficientofdetermination):表示方程中的每一个变量xi对减少余差平方和的边际贡献,表示xi对y的边际解释能力。如,y对两个自变量进行回归,在控制

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。