第13章 直线回归分析

第13章 直线回归分析

ID:1498602

大小:1.52 MB

页数:79页

时间:2017-11-12

第13章  直线回归分析_第1页
第13章  直线回归分析_第2页
第13章  直线回归分析_第3页
第13章  直线回归分析_第4页
第13章  直线回归分析_第5页
资源描述:

《第13章 直线回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、2021/6/91直线回归分析Linearregressionanalysis第十三章公共卫生学院统计与流行病学教研室2021/6/92前面讨论的线性相关用于描述两个随机变量X与Y之间线性联系的程度,结论所反映的是它们相互之间的关系,两变量并无主次之分2021/6/93随着所探索问题的深入,研究者通常更感兴趣于其中的一个变量如何定量地影响另一变量的取值:例如医学研究中常需要从某项指标估算另一项指标,如果这指标分别是测量变量X和Y,我们希望由X推算Y的值。我们称X为自变量,Y则称为依赖于X的因变量。如果Y与X的关系呈线性时,我们可以用线性回归(linearr

2、egression)描述两者的关系。2021/6/94“回归”名称的由来英国遗传统计学家F·Galton(1822-1911年)和他的学生、现代统计学的奠基者之一K.Pearson(1856-1936年)在研究父母身高与其子女身高的遗传问题时,观察了1078对夫妇,以每对夫妇中父亲的身高作为解释变量X,而取他们的一个成年儿子的身高作为被解释变量Y(应变量),将结果在平面直角坐标系上绘成散点图,发现趋势近乎一条直线。 计算出的回归直线方程:2021/6/95Galton数据散点图(英寸)2021/6/96Galton注意到:当父亲身高很高时,他的儿子的身高一

3、般不会比父亲身高更高同样如果父亲很矮,他的儿子也一般不会比父亲矮,而会向一般人的均值靠拢。2021/6/972021/6/98无论身材高还是矮的父亲所生儿子的身高有向人群的平均身高“回归”的趋势,这就是“回归”的生物学内涵人们借用“回归”一词来描述通过自变量(indepen-dentvariable)的数值来预测反应变量(responsevariable)的平均水平2021/6/99扩展一元线性回归多元线性回归Logistic回归Cox回归2021/6/910§1直线回归2021/6/911直线回归的概念又称简单回归,用于研究一个变量随另一个变量变化而变化

4、的数量依存关系(回归关系),从而预测或控制未知变量的一种统计分析方法,通过拟合线性方程来描述两变量间的回归关系应用条件要求因(应)变量Y呈正态分布自变量X是可以精确测量和控制的变量2021/6/912直线回归分析的一般步骤绘制散点图求回归系数及截距对回归方程及回归系数进行假设检验若有统计学意义,写出回归方程,画出回归直线2021/6/913直线回归方程一般表达式:a:截距(intercept),直线与Y轴交点的纵坐标(X=0)。b:斜率(slope),回归系数(regressioncoefficient)。或为Y

5、X的估计值,读作‘Yhat’2021/6

6、/914Y的总体均数自变量Slope总体斜率Intercept总体截距2021/6/915标准差相等EQUALSTANDARDDEVIATION对于任何X值,随机变量Y的标准差Y

7、X相等独立INDEPENDENCE每一观察值之间彼此独立线性LINEARITY反应变量均数与X间呈直线关系 Y

8、X=α+X直线回归模型的四个假定(LINE)正态NORMALITY对于任何给定的X,Y服从正态分布,均数为Y

9、X,标准差为Y

10、X2021/6/916xy线性 正态 独立 标准差相等2021/6/917回归系数b:斜率(slope),回归系数(regressi

11、oncoefficient)意义:X每改变一个单位,Y平均改变b个单位b>0,Y随X的增大而增大(减少而减少)——斜上b<0,Y随X的增大而减小(减少而增加)——斜下b=0,Y与X无直线关系——水平|b|越大,表示Y随X变化越快,直线越陡峭。2021/6/918xyaa2021/6/919回归系数b和截距a的计算b是根据最小二乘法原理(各实测点至直线的纵向距离的平方和最小)求得的其中,为X和Y的离均差积和为X的离均差平方和2021/6/920最小二乘(Leastsquares)法图解Yi估计值i残差i=Yi–估计值i寻找使S(残差i)2最

12、小的直线使各实际散点(Y)到直线的纵向距离的平方和最小。最小2021/6/921参数计算2021/6/9222021/6/9232021/6/924对【例13-1】资料进行回归分析2021/6/9252021/6/9262021/6/927回归参数a、b的解释斜率(b)当X每增加1个单位时,Y改变b个单位本例b=0.2041,表明在所研究的体重范围内,体重每增加1kg,心脏横径增加0.2041cmY的截距(a)当X=0时Y的平均值本例a=4.2121,表示体重为0时,心脏横径的期望值为4.2121cm(注意有时这种解释无实际意义)2021/6/928回归系

13、数的假设检验b≠0原因:①由于抽样误差引起,总体回归系数β=0②的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。