《回归和相关分析》PPT课件.ppt

《回归和相关分析》PPT课件.ppt

ID:52075834

大小:863.00 KB

页数:45页

时间:2020-03-31

《回归和相关分析》PPT课件.ppt_第1页
《回归和相关分析》PPT课件.ppt_第2页
《回归和相关分析》PPT课件.ppt_第3页
《回归和相关分析》PPT课件.ppt_第4页
《回归和相关分析》PPT课件.ppt_第5页
资源描述:

《《回归和相关分析》PPT课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第九章相关与回归主要内容一线性相关二秩相关三分类变量的关联性分析一线性相关的概念线性相关(linearcorrelation)又称简单相关(simplecorrelation),用于双变量正态分布(bivariatenormaldistribution)资料。其性质可由散点图直观的说明。目的:研究两个变量X,Y数量上的依存(或相关)关系。特点:统计关系二、相关系数的意义与计算1.意义:相关(correlationcoefficient)又称Pearson积差相关系数,用来说明具有直线关系的两变量间相关的密切程度与相关方向。2.计算:样本相关系数的计算公式为例9-

2、1某地15名3岁儿童体重与体表面积资料如表9.1,试求相关系数。由例9-1得由公式得相关系数的特点1.相关系数r是一个无量纲的数值,且-10为正相关,r<0为负相关;3./r/越接近于1,说明相关性越好./r/越接近于0,说明相关性越差.相关系数的统计推断(一)相关系数的假设检验例9-2继例9-1中算得r=-0926后,试检验相关是否具有统计学意义检验步骤本例n=15,r=-0.926,由公式(11-4)和公式(9-5)得本例,查界值表得,故拒绝接受,认为凝血酶浓度与凝血酶时间之间存在负相关。此结果与查表的结果是一致的。线性相关中应注意的问题1

3、.样本的相关系数接近零并不意味着两变量间一定无相关性.2.一个变量的数值人为选定时莫作相关.3.出现异常值时甚用相关.4.相关未必真有内在联系.5.分层资料盲目合并易出假象.简单回归分析Simplelinearregressionanalysis双变量计量资料:每个个体有两个变量值总体:无限或有限对变量值样本:从总体随机抽取的n对变量值(X1,Y1),(X2,Y2),…,(Xn,Yn)目的:研究X和Y的数量关系方法:回归与相关简单、基本——直线回归、直线相关简单回归分析直线回归的概念目的:研究应变量Y对自变量X的数量依存关系。特点:统计关系。X值和Y的均数的关系

4、不同于一般数学上的X和Y的函数关系为了直观地说明直线回归的概念,以15名健康人凝血酶浓度(X)与凝血时间(Y)数据(表9-1)进行回归分析,得到图9-1所示散点图(scatterplot)No.123456789101112131415X1.11.21.00.91.21.10.90.61.00.91.10.91.11.00.7Y141315151314161714161516141517由图9-1可见,凝血时间随凝血酶浓度的增加而减低且呈直线趋势,但并非所有点子恰好全都在一直线上,此与两变量间严格的直线函数关系不同,称为直线回归(linearregression

5、),其方程叫直线回归方程,以区别严格意义的直线方程。回归是回归分析中最基本、最简单的一种,故又称简单回归。样本线回归方程为各X处Y的总体均数的估计。简单线性回归模型1.a为回归直线在Y轴上的截距2.b为回归系数,即直线的斜率b的统计学意义是:X每增加(减)一个单位,Y平均改变b个单位残差(residual)或剩余值,即实测值Y与假定回归线上的估计值的纵向距离。求解a、b实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。原则:最小二乘法(leastsumofsquares),即可保证各实测点至直线的纵向距离的平方和最小回归参数的估计——最小二乘原则Y的

6、离均差,总变异残差回归的变异回归参数的估计方法简单回归分析为了直观地说明直线回归的概念,以15名健康人凝血酶浓度(X)与凝血时间(Y)数据(表9-1)进行回归分析,得到图9-1所示散点图(scatterplot)简单回归分析No.123456789101112131415X1.11.21.00.91.21.10.90.61.00.91.10.91.11.00.7Y141315151314161714161516141517简单回归分析本例:n=15ΣX=14.7ΣX2=14.81ΣY=224ΣXY=216.7ΣY2=3368简单回归分析回归方程的假设检验建立样本

7、直线回归方程,只是完成了统计分析中两变量关系的统计描述,研究者还须回答它所来自的总体的直线回归关系是否确实存在,即是否对总体有?1.方差分析Y的离均差,总变异残差回归的变异第二节线性回归的应用 (估计和预测)反映其抽样误差大小的标准误为例9-1中,第一观测值X1=1.1,0.4994,0.404,代入(9.8)式获得第一观测点X1对应的的标准误为0.1599Y的总体均数的95%置信区间为14.0957±(2.16)(0.1599)=(13.7502,14.4412)对象实测值X实测值Y预测值均值均值的标准误Y均值的95%CIY值的95%预测区间残差下限上限下限上

8、限11.11414.09

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。