实验设计与数据分析-5回归分析.pdf

实验设计与数据分析-5回归分析.pdf

ID:52456697

大小:167.43 KB

页数:27页

时间:2020-03-27

实验设计与数据分析-5回归分析.pdf_第1页
实验设计与数据分析-5回归分析.pdf_第2页
实验设计与数据分析-5回归分析.pdf_第3页
实验设计与数据分析-5回归分析.pdf_第4页
实验设计与数据分析-5回归分析.pdf_第5页
资源描述:

《实验设计与数据分析-5回归分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、实验设计与数据分析ExperimentalDesignandDataAnalysis城环学院硕士课程06授课人:阳春1回归分析RegressionAnalysis2变量间的相互关系•函数关系:非随机变量之间的关系可以通过一个函数式准确表达出来。•相关关系:随机变量或者随机变量和一般变量之间存在的随机关系,不能够用准确的数学表达式表达出来。3相关变量间的关系•因果关系:某一个变量的变化受一个或多个变量的影响。•平行关系:变量之间互为因果,或者共同受到其它因素的影响。4回归分析(regressionanalysis)•统计学上用于研究呈因果关系的变量之

2、间的关系。•回归分析的任务是揭示出呈因果关系的相关变量间的联系形式,建立它们之间的回归方程,利用所建立的回归方程,由自变量(原因)来预测、控制因变量(结果)。•一因一果:一元回归(线性、非线性);多因一果:多元回归(线性、非线性)5相关分析(correlationanalysis)•统计学上用于研究呈平行关系的变量之间的关系。•对两个变量间的直线关系进行相关分析称为简单相关分析(直线相关分析);•对多个变量进行相关分析时,研究一个变量与多个变量间的线性相关称为复相关分析;研究其余变量保持不变的情况下两个变量间的线性相关称为偏相关分析。6线性回归•对

3、于两个相关变量,一个变量用x表示,另一个变量用y表示,通过试验或调查获得两个变量的n对观测值:(x,y),(x,y),……,(x,y)1122nn•为了直观地看出x和y间的变化趋势,可将每一对观测值在平面直角坐标系描点,作出散点图。7散点图8•散点图直观地、定性地表示了两个变量之间的关系。•为了探讨它们之间的规律性,还必须根据观测值将其内在关系定量地表达出来。•回归方程就是内在关系的定量表达。9线性回归的数学模型•若绘制的散点图呈直线关系,又由于因变量y的实际观测值总是带有随机误差,因而因变量y的实际观测值y可用自变量x的实际观测值x表示ii为:y

4、i=α+βxi+εi(i=1,2,…,n)•x为可以观测的一般变量(也可以是可以观测的随机变量);y为可以观测的随机变量;ε(残差)为i2相互独立,且都服从N(0,)的随机变量σ•直线回归的数学模型。我们可以根据实际观测值2对α,β以及方差σ做出估计。10回归直线•在x、y直角坐标平面上可以作出无数条直线中最接近散点图中全部散点的直线用来表示x与y的直线关系,这条直线称为回归直线。•设回归直线的方程为:yˆ=a+bx•a是α的估计值,b是β的估计值11回归直线•a、b应使回归估计值与实际观测值y的偏差平方和最小(最小二乘法),即:22Q=∑(y−y

5、ˆ)=∑(y−a−bx)有最小值有最小值∂Q=−2∑(y−a−bx)=0∂a∂Q=−2∑(y−a−bx)x=0∂b12回归直线的求解•关于a和b的正规方程组(formalequations):an+b∑x=∑y2a∑x+b∑x=∑xy•系数a和b:∑xy−(∑x)(∑y)/n∑(x−x)(y−y)SPxyb===222SS∑∑x−(x)/n∑(x−x)xa=y−bx13回归直线的求解•式中的分子是自变量x的离均差与因变量y的离均差的乘积和∑(x−x)(y−y),简称乘积和,记作。SPxy2•分母是自变量x的离均差(偏差)平方和:∑(x−x)记作SS

6、。X•a叫做样本回归截距,是回归直线与y轴交点的纵坐标,当x=0时,yˆ=a;14回归直线的求解•b:样本回归系数(coefficientofregression),表示x改变一个单位,y平均改变的数量;b的符号反映了x影响y的性质,b的绝对值大小反映了x影响y的程度;•yˆ叫做回归估计值,是当x在在其研究范围内取某一个值时,y值平均数α+βx的估计值。15•回归方程的性质:2性质1Q=∑(y−yˆ)=最小;;性质2∑(y−yˆ)=0;性质3回归直线通过点(x,y)。•回归方程的中心化形式:yˆ=y−bx+bx=y+b(x−x)16线性回归的偏离度

7、估计2•偏差平方和∑(y−yˆ)的大小表示了实测点与回归直线偏离的程度,因而偏差平方和又称为离回归平方和。在直线回归分析中离回归平方和的自由度为n-2。于是可求得离回归均方为:2∑(y−yˆ)/(n−2)•离回归均方是模型中σ2的估计值。•离回归均方的平方根叫离回归标准误,记为Syx,2即Syx=∑(y−yˆ)/(n−2)17离回归标准误•离回归标准误S的大小表示了回归直线与实测点yx偏差的程度;•是回归估测值yˆ与实际观测值y偏差的程度;•离回归标准误S用来表示回归方程的偏离度。yx18直线回归的显著性检验•若x和y变量间并不存在直线关系,但由n

8、对观测值(x,y)也可以根据上面介绍的方法求得一ii个回归方程yˆ=a+bx。但回归方程所反应的两个变量间的直线关系是不真

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。