卫生学课件:第十二章 直线相关与回归(卫生学).ppt

卫生学课件:第十二章 直线相关与回归(卫生学).ppt

ID:59426583

大小:205.00 KB

页数:35页

时间:2020-09-19

卫生学课件:第十二章  直线相关与回归(卫生学).ppt_第1页
卫生学课件:第十二章  直线相关与回归(卫生学).ppt_第2页
卫生学课件:第十二章  直线相关与回归(卫生学).ppt_第3页
卫生学课件:第十二章  直线相关与回归(卫生学).ppt_第4页
卫生学课件:第十二章  直线相关与回归(卫生学).ppt_第5页
资源描述:

《卫生学课件:第十二章 直线相关与回归(卫生学).ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第十二章直线相关与回归环境与公共卫生学院闫洪涛探讨两个变量间的线性关系的一种统计分析方法直线相关(linearcorrelation)(简单相关,simplecorrelation):是探讨服从正态分布的两个变量X和Y有无线性相关关系的一种统计方法直线回归(linearregression)(简单回归,simpleregression):是探讨两个连续性变量X和Y间的数量依存关系的一种统计方法先确定相关关系---再作回归,分析其数量上的依存关系第一节直线相关直线相关分析的目的:解决服从正态分布的两个随机变量X和Y是否存在

2、线性关系,以及关系的密切程度和方向.例如,血压和年龄,疗效和药物剂量,胰岛素和血糖,胸围和肺活量之间是否有关系,我们可以先用简单的图来表示两个变量之间是否有关联.---散点图---用点的位置表示两变量间的数量关系和变化趋势表12-1.15名学生的某蛋白表达量和肺活量.试做相关分析.编号表达量肺活量123456789101112131415726878667065746469716560707569240022002750180027002500265021002000260023001900240025002350表达量

3、反映关联的密切程度和方向的指标----相关系数(correlationcoefficient)样本的相关系数r,总体的相关系数.一.相关系数的特点及意义:1.没有单位2.取值范围:-1≤r≤13.r的绝对值越接近于1,两变量的相关关系的密切程度越高.4.r>0正相关,r<0负相关;r=0无相关;r=1完全相关相关系数的定义(Pearson积差相关系数)二.相关系数的计算表:蛋白表达量和肺活量的相关分析.编号表达量(X)肺活量(Y)123456789101112131415726878667065746469716560

4、707569240022002750180027002500265021002000260023001900240025002350X2Y2XY51844624608443564900422554764096476150414225360049005625476157600004840000756250032400007290000625000070225004410000400000067600005290000361000057600006250000552250017280014960021450011880018

5、9000162500196100134400138000184600149500114000168000187500162150合计10363515071858835675002441450r=0.7194r=0.7194表达量三.相关系数的假设检验基本思想:检验总体相关系数是否为0,=0?当实际测得的样本的相关系数r0时,是总体的相关系数就不等于0,还是总体相关系数等于0,但因抽样误差造成的样本相关系数不等于0.检验方法:t检验:检验步骤:1.建立检验假设,确定检验水准H0:=0,H1:0,α=0.052.计

6、算统计量t值3.确定P值和判断结果以自由度df=n-2,查t界值表(P287,表9-9),确定P值.df=n-2r=0.7194tr=3.73t0.01(13)=3.012P<0.01查表法:根据自由度df=n-2,查相关系数r界值表(表12-3),确定P值.算得的r值>表中的r值,则P<其对应的概率.第二节直线回归两个连续性变量之间存在线性相关关系,进一步想要确定它们之间的数量关系,即以一个变量的值去推算另一个变量的值.这种统计分析方法---直线回归分析直线回归的主要任务:就是确定两个变量的数量依存关系,即自变量与应变

7、量的关系.直线回归的方法:根据两个变量的观察值,去获取一个直线回归方程,并确定一条最合适的回归直线,来描述两个变量变化的数量关系.一.直线回归方程(linearregressionequation)X–自变量,—应变量Y的估计值,a–样本回归直线在Y轴上的截距(intercept)b–样本回归系数(regressioncoefficient),回归直线的斜率.b的意义:表示当X变动一个单位时,Y平均变化多少个单位.b>0,Y随X增大而增大;b<0,Y随X增大而减小;b=0,X与Y没有直线线性关系回归方程中,a和b取不同的

8、数值可以获得不同的回归直线.当获得的回归直线,能保证各实测点到直线纵向距离的平方和为最小时,这时的a和b的值是最适宜的.根据公式求出a和b的值.回归方程中a和b的计算---最小二乘法原理例12-3前面相关分析的结果,某蛋白表达量和肺活量之间存在线性相关关系,进一步作回归分析.根据基本数据分别计算a和b,建立回归方程.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。