logistic回归-周虹

logistic回归-周虹

ID:40405023

大小:486.50 KB

页数:50页

时间:2019-08-01

logistic回归-周虹_第1页
logistic回归-周虹_第2页
logistic回归-周虹_第3页
logistic回归-周虹_第4页
logistic回归-周虹_第5页
资源描述:

《logistic回归-周虹》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、Logistic回归LogisticRegression公共卫生学院妇女与儿童青少年卫生学系周 虹多元线性回归分析:用来分析多个自变量与一个因变量的关系;模型中因变量Y是连续性随机变量,并要求服从正态分布。但是,在医学研究中,常碰到因变量为非连续性变量的情况。常见的有三类:二项分类:如药物实验中,动物出现死亡或生存,人群中某种疾病的患病与未患病,临床实验中药物的有效与无效等。多项有序分类:如某一药物的治疗结果是治愈、显效、有效、无效。多项无序分类:如研究肝炎的类型,分为甲、乙、丙、丁、戊型等。Logistic回归(疾病的病因分析)Logistic回归分析,主要用于因变量是分类变量的

2、回归分析。根据因变量分类的不同,常分为:-因变量为二分变量的Logistic回归;-因变量为多分类变量的Logistic回归。(有序多分类、无序多分类)此外还有用于分析匹配资料的条件Logistic回归等。研究对象未经过匹配的非条件Logistic回归和研究对象经匹配的条件Logistic回归。一、Logistic回归模型0为常数项或截距;1,2…..m分别为m个自变量的回归系数。Logit变换(也称对数单位转换)P为发病概率,取值0-1;1-P为不发病概率。取值:-∞~+∞=-4.00-2.000.002.004.00Z0.501.00Logistic回归模型的函数PLo

3、gisticfunction取值0-1,可描述/预测概率,Logistic模型是概率模型Logisticfunction呈S-形曲线,符合流行病学对危险因素与疾病风险关系的认识Logistic回归模型特点:Logistic回归的自变量(影响因素)-可以是连续变量,也可以是分类变量。-如果自变量中有分类变量,应以数字表示不同分类,如:“吸烟状况”为自变量X1,可以:X1=1表示吸烟X1=0表示不吸烟。二、回归模型参数的意义单纯从数学上讲,与多元线性回归分析中回归系数的解释并无不同,亦即βm表示Xm改变一个单位时,因变量的平均变化量,与衡量危险因素作用大小的比值比(OR)有一个对应的关

4、系。模型中回归系数:常用于解释病例-对照研究中的OR病例对照研究:是以确诊患有某特定疾病的病人作为病例,以不患有该病但具有可比性的个体作为对照,搜集既往可能的危险因素的暴露史,并通过统计学方法,评估暴露因素与疾病之间是否存在统计学上的关联。常用于疾病病因的探索。病例(MI)对照合计服OC392463未服OC114154268合计153178331例:口服避孕药(OC)与心肌梗塞(MI)关系-统计学检验X2=7.70,p<0.01结论为拒绝无效假设,即两组暴露率差异有统计学意义。比值比(Oddsratio,OR):考察关联强度大小,即暴露组的疾病危险性为非暴露组的多少倍。定量描述危险

5、因素与疾病之间的关系。比值Odds=P/(1-P)比值比OR=[P1/(1-P1)]/[P2/(1-P2)]设P表示暴露因素下个体发病的概率,则发病的概率P与未发病的概率1-P之比为比值。比值比OddsRatioOdds=P/(1-P)暴露组:P=a/(a+b)1-P=b/(a+b)Odds=a/b非暴露组:P=c/(c+d)1-P=d/(c+d)Odds=c/d病例对照暴露组ab非暴露组cdOR>1,疾病的危险度因暴露而增加;OR<1,疾病的危险度因暴露而减少;OR=1,疾病的发生与暴露无关。本例,OR=2.195,说明口服避孕药患心肌梗塞的危险是没有口服避孕药的2.195倍。当

6、一种病的死亡率(或发病率)近似于零时,1-P≈1,则有:OR≈P1/P0=RR,RR为相对危险度Logistic回归系数与OR的关系:有Logistic回归模型:如果要分析其中X2(假设是口服避孕药)变化一个单位对于的影响程度,可以计算当X2分别为(X2+1)和X2时的值,并计算其比值,此时其它变量保持相同,如下表:X1X2X3暴露(X2=1)X1X2+1X3非暴露(X2=0)X1X2X3Logistic回归系数与OR的关系:暴露:非暴露:例:logodds(Y=1)=-4.353+0.038ageY:妇女是否患有骨质疏松,Y=1为是,Y=0为否当年龄为a时,odds(Y=1

7、ag

8、e=a)=exp(-4.353+0.038a)当年龄为a+1,odds(Y=1

9、age=a+1)=exp(-4.353+0.038(a+1))Oddsratio=exp(0.038)=1.0387年龄每增加一岁,患骨质疏松的可能性增加3.87%Logistic回归方程求解参数采用最大似然估计法(Maximumlikehoodestimate)似然函数值(L)表达的是一种概率,即在假设拟合模型为真实情况时,能够观察到某一特定样本数据的概率,这个函数值在(0,1)之间。因

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。