多元logistic回归分析2017.pdf

多元logistic回归分析2017.pdf

ID:57067229

大小:1.76 MB

页数:46页

时间:2020-07-31

多元logistic回归分析2017.pdf_第1页
多元logistic回归分析2017.pdf_第2页
多元logistic回归分析2017.pdf_第3页
多元logistic回归分析2017.pdf_第4页
多元logistic回归分析2017.pdf_第5页
资源描述:

《多元logistic回归分析2017.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、Logistic回归分析1Logistic回归(LogisticRegression)是研究因变量为二分类或多分类观察结果与影响因素(自变量)之间关系的一种多变量分析方法,属概率型非线性回归。Logistic回归的分类:(1)二分类资料Logistic回归:因变量为两分类变量的资料,可用非条件Logistic回归和条件Logistic回归进行分析。非条件Logistic回归多用于非配比病例-对照研究或队列研究资料,条件Logistic回归多用于配对或配比资料。(2)多分类资料Logistic回归:因

2、变量为多项分类的资料,可用多项分类Logistic回归模型或有序分类Logistic回归模型进行分析。2非条件Logistic回归分析条件Logistic回归分析Logistic回归分析应用及注意事项3第一节非条件logistic回归一、logistic回归模型:设因变量Y是一个二分类变量,其取值为Y=1和Y=0。影响Y取值的m个自变量分别为X1,X2,,Xm。在m个自变量(即暴露因素)作用下阳性结果发生的条件概率为PP(Y1X1,X2,,Xm),则logistic回归模型可表示为:e

3、xp(01X12X2mXm)P(15.1)1exp(01X12X2mXm)其中,0为常数项,1,2,,m为偏回归系数。4设Z01X12X2mXm,则Z与P之间关系的logistic曲线如下图所示。可看出:当Z趋于时,P值渐进于1;当Z趋于时,P值渐近于0;P值的变化在0~1之间,并且随Z值的变化以点(0,0.5)为中心成对称S形变化。5Plogit变换:logitP=ln为P的logit变换,1P通过logit变换之后,

4、就可将0P1的资料转换为logit(P)的资料。作logit变换后,logistic回归模型可以表示成如下的线性形式:Pln01x12x2mxm1P6模型参数的流行病学含义当各种暴露因素为0时:Pln()XXX01122mm1P00010m可看出:常数项0是当各种暴露因素为0时,个体发病与不发病概率之比的自然对数值。偏回归系数j(j1,2,,m)表示在其它自变量固定的条件下,第j个自变量每改变一个单位

5、时logit(P)的改变量。它与比数比(优势比)OR(oddsratio)有对应关系。7在其它影响因素相同的情况下,某危险因素X两个j不同暴露水平c和c发病优势比的自然对数为:10P1(1P1)P1P0lnORjln=ln()ln()P0(1P0)1P11P0=j(c1c0)则该因素的优势比:ORjexp[j(c1c0)]式中P1和P0分别表示在Xj取值为c1和c0时的发病概率,ORj为调整后优势比(adjustedoddsratio),表示扣除了其它自变量影响后危

6、险因素Xj的作用。8二、logistic回归模型的参数估计logistic回归模型的参数估计常采用最大似然估计。其基本思想是先建立似然函数与对数似然函数,求使对数似然函数最大时的参数值,其估计值即为最大似然估计值。在病例-对照研究中,假设变量y取值1和0分别表示对象患病和不患病;变量x取值1和0表示具有和不具有某种危险因素;具体调查数据见下表:表1调查数据表2对应概率yxyx10101ab1pp120cd01-p1-p12合计a+cb+d合计119表1调查数据表2对应概率yxyx10101ab1pp

7、120cd01-p1-p12合计a+cb+d合计11exp(x)Logistic模型为:pp(y1

8、x)11exp(x)则四个格子所对应的概率分别是:exp()exp()pp(y1

9、x1);pp(y1

10、x0)121exp()1exp()111pp(y0

11、x1);1pp(y0

12、x0)121exp()1exp()则似然函数为:exp()aexp()b1c1dL[][][][]1exp()1exp(

13、)1exp()1exp()10表1调查数据表2对应概率yxyx10101ab1pp120cd01-p1-p12合计a+cb+d合计11为使似然函数值最大,首先对函数两边取对数:Qln(L)a()aln[1exp()]bbln[1exp()]cln[1exp()]dln[1exp()]对Q分别求关于和的一阶偏导数,得到关于和的线性方程组,解方程组得:bln(b/d)0adbln(a/c)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。