欢迎来到天天文库
浏览记录
ID:50925722
大小:1.60 MB
页数:87页
时间:2020-03-08
《医学高级统计学_第六章logistic回归II.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、logistic族回归(II)姜晶梅流行病与统计学系北京协和医学基础学院2018.04.26主要内容预备知识关于配对数据的模型条件似然函数匹配设计的条件logistic回归多类结果变量的logistic回归有序结果的累积比数logistic回归logistic族回归模型的统计概要2复习并加强:线性回归模型的结构yXEy()Xioi11o11当yi1时,Py()ip当yi0时,Py()1ip根据随机变量的一般定义有Ey()i()1ypyi(iii1)0(1pypy(1))显然,该模型可以描述当py(io1)11X
2、自变量变化时,因变量的发生概率会怎样变化复习:logistic回归模型的结构plog()itXlnojj1j1概率预报模型为pexp()0jjXj1p1exp()0jjXj111p1exp(0jjX)j1logistic回归对资料的要求(1)反应变量为二分类的分类变量;(2)自变量与logit(P)之间为线性关系;(3)残差合计为0,且服从二项分布;(4)各观测间相互独立。5复习:回归参数的意义p()xpjjX0j1OddsXeeexp()ojj1()xj1()(XX)()jjX
3、....ee0ee1122指数关系为在其他x保持不变的情况下,x每增加一个单位所导致1的相对风险是原来相对风险的exp(β)倍,即x+1水平的优势等于x1水平的优势乘以exp(β)。1流行病学病因学研究中的常用指标PP/(1)11ORPP/(1)00注意:OR与RR的关系回归系数的几何意义>0<00.5Pp00xxLogit函数得出的事件(Y=1)的概率分布呈S型,对于无穷小或无穷大的指标Z(x)值,事件(Y=1)的概率总在区间【0,1】内变动。此外,Logit函数总是关于拐点P(Y=1)=0.5对称。自变量X对应的参数β的正负号与绝对值大小,分别决定了S形性状与方向。回
4、归参数的估计——采用极大似然估计法Logit变换使回归函数线性化,并满足了0()EY1p,但没有消除误差项的方差不同质性问题,这时用最小二乘法估计的参数尽管无偏,但不能满足方差最小的性质。最大似然法的基本思想是先建立似然函数与对数似然函数,再通过使对数似然函数最大求解相应的参数值,所得到的估计值称为参数的最大似然估计值。当各事件独立发生时,则n个观察对象所构成的似然函数L是每一观察对象的似然函数贡献量的乘积,即似然函数nL=yyii(1)1iii1pyi1yi0jijxnj1e1=ppi100jijxxji
5、j11eejj11对似然函数取对数形式:px0jijnnej11lnlnLy(1y)lnppiiii1100jijxxjij11eejj11对于参数(jp1,2,,),令lnL的一阶导数为0,jlnL即0,用Newton-Raphson迭代方法解方程组,j得出参数的估计值b和b的渐进标准误S。jjjbj回归模型的假设检验对于模型检验,共有三种方法:(1)Wald检验(2)对数似然比检验(3)得分检验它们在logistic模型的分析中起重要作用,但作用略有差别
6、回归模型的假设检验(1)Wald检验该检验是通过比较值来进行的,它基于值服从正态分布的假设,首先求出值的标准误,然后基于正态分布的原理求出P值。参数可信区间的估计就是基于Wald检验的。在SPSS的所有结果输出中,关于的所有检验都进行的是Wald检验。注意:由于Wald统计量在实际上未考虑各因素的综合作用,当因素之间存在严重共线时,结果不可靠。因为参数的可信区间是基于Wald统计量计算的,故以参数的95%可信区间来筛选变量亦应慎重。lnL0j回归模型的假设检验(2)对数似然比检验似然比统计量是通过比较两个相嵌套模型的对数似然函数统计量来进行的,其统计量为:LPGL
7、LL2lnL2(lnln)(2ln)(2ln)PKPKLK2~(-KP)的个数其中,L为未包含某个(几个)参数模型的似然函数,Lk为未包p含某个(几个)参数模型的似然函数,当样本含量较大时,该统计量服从2分布。第一部分预备知识13复习:关于匹配病例对照研究中,为了增强统计效率,通常会采用匹配(matching)设计,即要求对照在某些因素或特征上与病例保持一致,目的是排除匹配因素的混杂干扰。例如
此文档下载收益归作者所有