Logistic回归分析及应用

Logistic回归分析及应用

ID:38567554

大小:1.76 MB

页数:76页

时间:2019-06-15

Logistic回归分析及应用_第1页
Logistic回归分析及应用_第2页
Logistic回归分析及应用_第3页
Logistic回归分析及应用_第4页
Logistic回归分析及应用_第5页
资源描述:

《Logistic回归分析及应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第十六章Logistic回归分析Logisticregression1复习  多元线性回归(multiplelinearregression)在医学实践中,常会遇到一个应变量与多个自变量数量关系的问题。如医院住院人数不仅与门诊人数有关,而且可能与病床周转次数,床位数等有关;儿童的身高不仅与遗传有关还与生活质量,性别,地区,国别等有关;人的体表面积与体重、身高等有关。2表1多元线性回归分析的数据结构实验对象yX1X2X3….XP1y1a11a12a13…a1p2y2a21a22a23…a2p3y3a31a32a33…a3p………………… nynan1an2an3…anp━

2、━━━━━━━━━━━━━━━━━其中:y取值是服从正态分布3多元线性回归模型通过实验测得含有p个自变量x1,x2,x3,…,xp及一个因变量y的n个观察对象值,利用最小二乘法原理,建立多元线性回归模型:其中b0为截距,b1,b2…bp称为偏回归系数.bi表示当将其它p-1个变量的作用加以固定后,Xi改变1个单位时Y将改变bi个单位.4logisticregressionanalysisLogistic回归分析及其应用5(一)基本概念和原理1.应用背景Logistic回归模型是一种概率模型,适合于病例—对照研究、随访研究和横断面研究,且结果发生的变量取值必须是二分的或多

3、项分类。可用影响结果变量发生的因素为自变量与因变量,建立回归方程。6设资料中有一个因变量y、p个自变量x1,x2,…,xp,对每个实验对象共有n次观测结果,可将原始资料列成表2形式。2、Logistic回归模型的数据结构7表2Logistic回归模型的数据结构实验对象yX1X2X3….XP1y1a11a12a13…a1p2y2a21a22a23…a2p3y3a31a32a33…a3p………………… nynan1an2an3…anp━━━━━━━━━━━━━━━━━━其中:y取值是二值或多项分类8表3肺癌与危险因素的调查分析例号是否患病性别吸烟年龄地区1110300210

4、14613000351………………30000261注:是否患病中,‘0’代表否,‘1’代表是。性别中‘1’代表男,‘0’代表女,吸烟中‘1’代表吸烟,‘0’代表不吸烟。地区中,‘1’代表农村,‘0’代表城市。9表4配对资料(1:1)对子号病例对照x1x2x3x1x2x3113010120311303012020…………………10222000注:X1蛋白质摄入量,取值:0,1,2,3X2不良饮食习惯,取值:0,1,2,3X3精神状况,取值:0,1,210Logistic回归--Logistic回归与多重线性回归联系与区别联系:用于分析多个自变量与一个因变量的关系,目的是矫

5、正混杂因素、筛选自变量和更精确地对因变量作预测等。区别:线性模型中因变量为连续性随机变量,且要求呈正态分布.Logistic回归因变量的取值仅有两个,不满足正态分布。113、Logistic回归模型令:y=1发病(阳性、死亡、治愈等)y=0未发病(阴性、生存、未治愈等)将发病的概率记为P,它与自变量x1,x2,…,xp之间的Logistic回归模型为:可知,不发病的概率为:12经数学变换得:定义:为Logistic变换,即:134、回归系数βi的意义流行病学的常用指标优势比(oddsratio,OR)或称比数比,定义为:暴露人群发病优势与非暴露人群发病优势之比。即Xi的

6、优势比为:14故对于样本资料OR=exp()95%置信区间为:可见是影响因素Xi增加一个单位所引起的对数优势的增量,反映了其对Y作用大小。如果要比较不同因素对Y作用大小,需要消除变量量纲的影响,为此计算标准化回归系数155.假设检验(1)回归方程的假设检验H0:所有H1:某个计算统计量为:G=-2lnL,服从自由度等于n-p的分布(2)回归系数的假设检验H0:H1:计算统计量为:Wald,自由度等于1。16(二)Logistic回归类型及其实例分析1、非条件Logistic回归当研究设计为队列研究、横断面研究或成组病例对照研究时,可以用非条件Logistic回归。17实

7、例1某研讨究者调查了30名成年人,记录了同肺癌发病的有关因素情况,数据见表4。其中是否患病中,‘0’代表否,‘1’代表是;性别中‘1’代表男,‘0’代表女;吸烟中‘1’代表吸烟,‘0’代表不吸烟;地区中,‘1’代表农村,‘0’代表城市。试分析各因素与肺癌间的关系。18表5肺癌与危险因素的调查分析例号是否患病性别吸烟年龄地区111030021014613000351………………30000261注:是否患病中,‘0’代表否,‘1’代表是。性别中‘1’代表男,‘0’代表女,吸烟中‘1’代表吸烟,‘0’代表不吸烟。地区中,‘1’代表农村,‘0’代

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。