十三、logistic回归模型.ppt

十三、logistic回归模型.ppt

ID:50713816

大小:681.51 KB

页数:82页

时间:2020-03-15

十三、logistic回归模型.ppt_第1页
十三、logistic回归模型.ppt_第2页
十三、logistic回归模型.ppt_第3页
十三、logistic回归模型.ppt_第4页
十三、logistic回归模型.ppt_第5页
资源描述:

《十三、logistic回归模型.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、二分类logistic回归模型内容提要非条件logistic回归模型简介简单分析实例哑变量设置自变量的筛选方法与逐步回归模型拟合效果与拟合优度检验模型的诊断与修正条件logistic回归对分类变量的分析,当考察的影响因素较少,且也为分类变量时,常用列联表(ContingencyTable)进行整理,并用2检验或分层2检验进行分析,但存在以下局限性:无法描述其作用大小和方向,更不能考察各因素间是否有交互作用;当控制的分层因素较多时,将导致检验结果不可靠;2检验无法对连续性自变量进行分析(致命缺陷)。模型简介logistic回归模型适合于应变量为二项分类的资料,在医学研究领域中的应用广泛。如

2、流行病病因学研究(包括队列研究、病例对照研究、横断面研究等)、临床疗效研究(如疗效与治疗方法、患病轻中重等因素关系)、卫生服务研究(如是否就诊与性别、年龄、文化程度的关系)等等。模型简介一、问题的提出举例:分析“新生儿出生体重”的影响影响,如果以新生儿出生时的体重为因变量,采用线性回归分析的方法。线性回归分析:因变量Y是连续性随机变量,并且呈正态分布,理论上因变量必须能够在–∞到+∞之间自由取值问题的提出(续)但在医学研究中常碰到因变量的取值仅有两个,如是否发病、死亡或痊愈等;分析“母亲怀孕期间体重增加”对“新生儿出生低体重”的影响二、概念的引入如按线性回归思想建立模型:P=α+βXP的意义是

3、发生出生低体重的概率在线性回归模型中,X的取值是任意的,P值可能大于1或小于0,无法从医学意义进行解释,显然不适宜用线性回归建立预测模型。为避免P值大于1或小于0,我们对P进行logit(即logistic)变换,把logit(P)作为因变量,即:Logit(P)=ln[p/(1-p)]=+xlogit(P)可以从–∞到+∞之间取任何值如:计算logit(0.1),logit(0.95)logit(0.1)=ln(0.1/0.9)=-2.20logit(0.95)=ln(0.95/0.05)=2.941.如果以logitP为因变量,暴露因素X为自变量,建立直线回归方程:LogitP=+

4、x由LogitP=ln[p/(1-p)]可导出:ln[p/(1-p)]=+x(1)即单因素线性LOGISTIC回归模型公式;“p=在暴露变量E下有病D的概率”解(1)式中以p为反应变量的方程,得:(2)即单因素曲线LOGISTIC回归模型公式。单因素LOGISTIC模型参数的解释ln[p/(1-p)]=+x:与变量x无关的因素的影响:自变量x的回归系数,大小由因素x决定。=0表明P与x无关,发病不由因素x决定;>0表明P与x有关,变量x是疾病发生的危险因素;<0表明P与x有关,变量x是疾病发生的保护因素。LogitP与OddsRatio(OR)OddsRatio(OR):即两

5、个Odds的比值,是描述因素与疾病之间联系强度的指标,可以用来确定定群研究(队列研究)和病例对照研究中暴露研究因素与疾病发生之间关联的性质和强弱。OR=1表明疾病D与因素x无关,发病不由因素x决定;OR>1表明疾病D与因素x有关,变量x是疾病发生的危险因素;OR<1表明疾病D与因素x有关,变量x是疾病发生的保护因素。对于队列研究,假设研究一个二值暴露变量X与某一疾病之间的关联:设暴露组(E+)发病的概率为P1,则其发病与不发病的概率比为:Odds=P1/(1-P1)(3)设非暴露组(E-)发病的概率为P0,则其发病与不发病的概率比为:Odds=P0/(1-P0)(4)根据OR定义,得:OR=[

6、P1/(1-P1)]/[P0/(1-P0)](5)两边取自然对数,得:lnOR=ln[P1/(1-P1)]-ln[P0/(1-P0)](6)用LogitP的值带入,得:lnOR=LogitP1-LogitP0=(1+1x1)-(0+0x0)队列研究中假定暴露人群和非暴露人群影响疾病发生的其他因素均相同,则可认为:1=0;在非暴露人群中不暴露研究因素,可知:x0=0,带入,得:lnOR=(1+1x1)-(0+0x0)=1x1则:OR=Exp[(1+1x1)-(0+0x0)]=Exp(1x1)(7)即:OR=e13.多因素LOGISTIC回归模型与混杂因素的控制线

7、性LOGISTIC回归模型公式:(8)或:曲线LOGISTIC回归模型公式:(9)多因素LOGISTIC模型参数的解释:与变量xi无关的因素的影响;i:自变量xi的回归系数,大小由因素xi决定,是控制了其他因素的混杂效应后的i值。i=0:表明P与xi无关,发病不由因素xi决定;i>0:表明P与xi有关,变量xi是疾病发生的危险因素;i<0:表明P与xi有关,变量xi是疾病发生的保护因素

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。