相关与回归分析2.ppt

相关与回归分析2.ppt

ID:49501686

大小:443.00 KB

页数:31页

时间:2020-02-06

相关与回归分析2.ppt_第1页
相关与回归分析2.ppt_第2页
相关与回归分析2.ppt_第3页
相关与回归分析2.ppt_第4页
相关与回归分析2.ppt_第5页
资源描述:

《相关与回归分析2.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、[回顾]线性相关分析:计算线性相关系数r确定两变量之间的相关方向与密切程度。[不足]无法表明两变量之间的因果关系无法从一个或几个变量(xi)的变化来推测另一个变量(y)的变化情况。10名用餐顾客消费金额与所付小费数据如下:r=0.92回归这个术语是由英国著名统计学家FrancisGalton在19世纪末期研究孩子及其父母的身高时提出来的。Galton发现身材高的父母,他们的孩子身材也高。但这些孩子平均起来并不像他们的父母那样高。对于比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们的父母

2、的平均身高。Galton把这种孩子的身高向平均值靠近的趋势称为一种回归效应,而他发展的研究两个数值变量的方法称为回归分析。趋向平均高度的回归回归:退回regression1877年弗朗西斯•高尔顿爵士遗传学研究平均身高回归分析产生的历史关于相关关系的研究已形成两个重要分支相关分析回归分析通过一个(些)变量的变化解释另一变量的变化,是寻找具有相关关系变量间的数学模型——回归方程,并进行统计推断和控制的一种统计方法。y=a+bx、y=a+b1x1+b2x2、y=0+1x1+2x2+…+nxn回归分析(一)[

3、回归]英国生物学家F·Galton首次提出。父辈身高子辈身高xyy=f(x)+人类的平均身高。[目的]在于通过X的已知或设定值,去估计或预测Y的(总体)均值。变量Y是被预测或被解释的变量,称为因变量(DependentVariable)或被解释变量(ExplainedVariable)变量X是用来预测或解释因变量的变量,称为自变量(IndependentVariable)或解释变量(ExplanatoryVariable)变量间关系的对等性不同。相关分析中,变量x变量y处于平等的地位;回归分析中,变量y

4、称为因变量,处在被解释的地位,称为x自变量,用于预测因变量的变化。变量的随机性不同。相关分析中,变量x,y均为随机变量;回归分析中,y为随机变量,x可以是随机变量,也可以是非随机的确定变量。计算结果表现不同。相关系数反映两变量相关程度和方向,回归系数反映当自变量每增加一个单位时,因变量的平均增加值。对于没有明显因果关系的两个线性相关变量可求得两个回归方程。而相关系数只有一个。相关分析与回归分析的区别相关分析与回归分析的区别相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量对变量的影响大小

5、,还可以由回归方程进行预测和控制。我们不能把回归分析看作是在变量间建立一个因果关系的过程。回归分析只能表明,变量是如何或者是以怎样的程度彼此联系在一起的。有关因果关系的任何结论,必须建立在理论分析的基础之上。注意相关分析与回归分析的联系相关分析和回归分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意

6、义。简单说:1、相关分析是回归分析的基础和前提;2、回归分析是相关分析的深入和继续。ζ2.一元线性回归模型可表示为※Y是X的线性函数(部分)加上误差项※线性部分反映了由于X的变化而引起的Y的变化※β0和β1称为回归模型的参数※误差项ε是随机变量--反映了除X和Y之间的线性关系之外的随机因素对Y的影响--是不能由X和Y之间的线性关系所解释的变异性(二)一元线性回归模型1.描述因变量Y如何依赖于自变量X和误差项ε的方程称为回归模型ε3.一元线性回归模型的基本假定1)线性假设。误差项ε是一个期望值为0的随机变量,即E

7、(ε)=0。2)同方差假设。对于所有的X值,ε的方差σ2都相同3)正态性假设。误差项ε是一个服从正态分布的随机变量,且相互独立。即ε服从N(0,σ2)4)独立性假设。对于一个特定的X值,它所对应的ε与其他X值所对应的ε不相关;对于一个特定的X值,它所对应的Y值与其他X所对应的Y值也不相关(三)回归方程(regressionequation)定义:描述因变量y的期望值如何依赖于自变量x的方程,称为回归方程。一元线性回归方程的形式如下E(y)=0+1x方程的图示是一条直线,也称为直线回归方程0是回归直线在y轴

8、上的截距,是当x=0时,y的期望值1是直线的斜率,表示x每变动一个单位时,y的平均变动值(四)估计的回归方程(estimatedregressionequation)一元线性回归中估计的回归方程为用样本统计量和代替回归方程中的未知参数和,就得到了估计的回归方程总体回归参数和是未知的,必须利用样本数据去估计其中:是估计的回归直线在y轴上的截距;是直线的斜率,表示x每变动一个单位时,y的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。