医学高级统计学_第六章logistic回归II.pdf

医学高级统计学_第六章logistic回归II.pdf

ID:50925722

大小:1.60 MB

页数:87页

时间:2020-03-08

医学高级统计学_第六章logistic回归II.pdf_第1页
医学高级统计学_第六章logistic回归II.pdf_第2页
医学高级统计学_第六章logistic回归II.pdf_第3页
医学高级统计学_第六章logistic回归II.pdf_第4页
医学高级统计学_第六章logistic回归II.pdf_第5页
资源描述:

《医学高级统计学_第六章logistic回归II.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、logistic族回归(II)姜晶梅流行病与统计学系北京协和医学基础学院2018.04.26主要内容预备知识关于配对数据的模型条件似然函数匹配设计的条件logistic回归多类结果变量的logistic回归有序结果的累积比数logistic回归logistic族回归模型的统计概要2复习并加强:线性回归模型的结构yXEy()Xioi11o11当yi1时,Py()ip当yi0时,Py()1ip根据随机变量的一般定义有Ey()i()1ypyi(iii1)0(1pypy(1))显然,该模型可以描述当py(io1)11X

2、自变量变化时,因变量的发生概率会怎样变化复习:logistic回归模型的结构plog()itXlnojj1j1概率预报模型为pexp()0jjXj1p1exp()0jjXj111p1exp(0jjX)j1logistic回归对资料的要求(1)反应变量为二分类的分类变量;(2)自变量与logit(P)之间为线性关系;(3)残差合计为0,且服从二项分布;(4)各观测间相互独立。5复习:回归参数的意义p()xpjjX0j1OddsXeeexp()ojj1()xj1()(XX)()jjX

3、....ee0ee1122指数关系为在其他x保持不变的情况下,x每增加一个单位所导致1的相对风险是原来相对风险的exp(β)倍,即x+1水平的优势等于x1水平的优势乘以exp(β)。1流行病学病因学研究中的常用指标PP/(1)11ORPP/(1)00注意:OR与RR的关系回归系数的几何意义>0<00.5Pp00xxLogit函数得出的事件(Y=1)的概率分布呈S型,对于无穷小或无穷大的指标Z(x)值,事件(Y=1)的概率总在区间【0,1】内变动。此外,Logit函数总是关于拐点P(Y=1)=0.5对称。自变量X对应的参数β的正负号与绝对值大小,分别决定了S形性状与方向。回

4、归参数的估计——采用极大似然估计法Logit变换使回归函数线性化,并满足了0()EY1p,但没有消除误差项的方差不同质性问题,这时用最小二乘法估计的参数尽管无偏,但不能满足方差最小的性质。最大似然法的基本思想是先建立似然函数与对数似然函数,再通过使对数似然函数最大求解相应的参数值,所得到的估计值称为参数的最大似然估计值。当各事件独立发生时,则n个观察对象所构成的似然函数L是每一观察对象的似然函数贡献量的乘积,即似然函数nL=yyii(1)1iii1pyi1yi0jijxnj1e1=ppi100jijxxji

5、j11eejj11对似然函数取对数形式:px0jijnnej11lnlnLy(1y)lnppiiii1100jijxxjij11eejj11对于参数(jp1,2,,),令lnL的一阶导数为0,jlnL即0,用Newton-Raphson迭代方法解方程组,j得出参数的估计值b和b的渐进标准误S。jjjbj回归模型的假设检验对于模型检验,共有三种方法:(1)Wald检验(2)对数似然比检验(3)得分检验它们在logistic模型的分析中起重要作用,但作用略有差别

6、回归模型的假设检验(1)Wald检验该检验是通过比较值来进行的,它基于值服从正态分布的假设,首先求出值的标准误,然后基于正态分布的原理求出P值。参数可信区间的估计就是基于Wald检验的。在SPSS的所有结果输出中,关于的所有检验都进行的是Wald检验。注意:由于Wald统计量在实际上未考虑各因素的综合作用,当因素之间存在严重共线时,结果不可靠。因为参数的可信区间是基于Wald统计量计算的,故以参数的95%可信区间来筛选变量亦应慎重。lnL0j回归模型的假设检验(2)对数似然比检验似然比统计量是通过比较两个相嵌套模型的对数似然函数统计量来进行的,其统计量为:LPGL

7、LL2lnL2(lnln)(2ln)(2ln)PKPKLK2~(-KP)的个数其中,L为未包含某个(几个)参数模型的似然函数,Lk为未包p含某个(几个)参数模型的似然函数,当样本含量较大时,该统计量服从2分布。第一部分预备知识13复习:关于匹配病例对照研究中,为了增强统计效率,通常会采用匹配(matching)设计,即要求对照在某些因素或特征上与病例保持一致,目的是排除匹配因素的混杂干扰。例如

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。