双变量关联性分析

双变量关联性分析

ID:9962886

大小:630.50 KB

页数:14页

时间:2018-05-17

双变量关联性分析_第1页
双变量关联性分析_第2页
双变量关联性分析_第3页
双变量关联性分析_第4页
双变量关联性分析_第5页
资源描述:

《双变量关联性分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第十三章双变量关联性分析第十三章双变量关联性分析在医学研究中,常会观察到两个变量之间在数量上存在某种协同变化的关系,例如随着体内凝血酶浓度的升高,其凝血时间随之降低等。这类关系在统计学上称为两个随机变量之间的关联性。如何判断两变量间的关联性是否确实存在,以及如何描述关联的方向与密切程度是本章所要介绍的内容。需要指出的是,关联性只反映变量间数量上的关系,但数量上的关联并不表示专业上的因果关系,其是否反映了变量间的因果关系还需其他手段加以确认。本章介绍两个定量变量间的直线相关和两个分类变量间关联性的统计分析方法。第一节直线相关一、

2、直线相关的概念及其统计描述例13.1某医师测量了15名正常成年人的体重(kg)与CT双肾体积(ml)大小,数据如表13.1所示。据此回答两变量是否有关联?其方向与密切程度如何?表13.115名正常成年人体重和双肾体积的测量值编号体重(kg)双肾体积(ml)143217.22274316.18351231.11458220.96550254.70665293.84754263.28857271.73967263.461069276.531180341.151248261.001338213.201485315.121554252

3、.08初步判断两变量间关系最直观有效的方法就是在平面直角坐标系中绘图,其中一个变量用表示,另一变量用表示,在平面直角坐标系中可绘制这些实测13-14第十三章双变量关联性分析点的分布情况,称为散点图(scatterplot),如图13.1所示。双肾体积(ml)y体重(kg)x图13.115名正常成年人体重和双肾体积的散点图由上图可见,两变量的散点分布大致呈直线趋势,其数量变化的方向相同。在统计学上两个随机变量之间呈直线趋势的关系被称为直线相关(linearcorrelation),又称简单相关(simplecorrelation

4、),其性质可由图13.2所示散点图作直观说明。(a)(b)(c)(d)图13.2常见的散点图图13.2(a)、(b)中散点近似呈椭圆形分布,其变化趋势接近一直线,其中图13.2(a)中两变量同时增大或减小,变化趋势同向,称为正相关(positivecorrelation)。图13.2(b)中一个变量随着另一个变量的增大而减小,变化趋势相反,称为负相关(negativecorrelation)。如全部数据点恰好散布在一条直线上,称为完全相关,这种特殊情况在实际医学研究中并不存在。图13.2(c)中各点总的趋势杂乱无章或大致呈圆形

5、散布,则该两变量间无相关,也称零相关(zerocorrelation)。图13.2(d)中各点散布也非直线趋势,亦属无相关,由于统计学中提到的相关通常是指直线相关,故无相关是指无直线关系,但可能存在非直线相关。二、相关系数的意义及计算13-14第十三章双变量关联性分析定量描述两个变量间直线关系的方向和密切程度的指标,称为直线相关系数(linearcorrelationcoefficient),又称Pearson积矩相关系数(Pearsonproductmomentcoefficient),其公式为:(13.1)相关系数没有单位

6、,取值范围在之间,其正负表示两变量间直线相关的方向,大于0为正相关,小于0为负相关,等于0为零相关。相关系数的绝对值大小表示两变量间直线相关的密切程度,绝对值越接近于1,说明相关密切程度越高;绝对值越接近于0,说明相关密切程度越低。现结合图13.1解释相关系数的含义。经横纵坐标上与处两条相互垂直的直线可将此图分为4个象限,若两变量呈正相关,多数数据处于第一、三象限,此时式(13.1)的分子为正数,;若两变量呈负相关,多数数据处于第二、四象限,此时式(13.1)的分子为负数,。其中一个极端是所有数据均位于经过点(,)的直线上,即

7、全部数据点要么都在第一、三象限,要么都在第二、四象限,此时式(13.1)的分子各项的正负号完全相同,相加后得到其最大或最小值,或,分别对应于完全正相关或完全负相关;另一个极端是所有数据围绕点(,)成圆形均匀分布在4个象限内,此时式(13.1)的分子各项相加后正负号相互抵消,分子为0,,即零相关。通过以上解释可知,式(13.1)中位于分子的离均差乘积和()可反映两变量直线相关的方向和密切程度。如同在单变量描述中,用离均差平方和的平均值即方差来反映数据的离散程度,以消除样本含量不同的影响一样,可将两变量的离均差乘积之和取平均,得到

8、样本协方差,以便不同样本含量的问题比较其相关性。协方差用符号表示,计算公式为:(13.2)协方差的取值大小与x、y的量纲有关,不同实际问题中的协方差不可直接比较。为了消除量纲的影响,13-14第十三章双变量关联性分析将两变量分别进行标准化(每个观察值减去均数再除以其标准差)后

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。