logistic回归

logistic回归

ID:47093540

大小:671.50 KB

页数:17页

时间:2019-07-25

logistic回归_第1页
logistic回归_第2页
logistic回归_第3页
logistic回归_第4页
logistic回归_第5页
资源描述:

《logistic回归》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、定性资料的回归分析------Logistic回归Logistic模型的主要用途:1.用作影响因素分析2.作为判别分析方法第一节二分类变量的logistic回归逻辑回归区别于线性回归,最主要的特点就一个:它的因变量是0-1型数据。啥是0-1型数据?就是这个数据有且仅有两个可能的取值。数学上为了方便,把其中一个记作0,另外一个记作1.例1:购买决定:我是买呢?还是买呢?还是买呢?如果您的决策永远是:买、买、买,这不是0-1数据。我们说的购买决策是:买还是不买?定义:1=购买,0=不购买。这个关于购买决定的0-1变量老牛了。为啥?因为它支撑了太多的重要应

2、用。例如,我生产了一瓶矿泉水,叫做“农妇山泉有点咸”,到底卖给谁呢?为此,我们需要做市场定位。什么是市场定位?市场定位从回归分析的角度看,就是想知道:谁会买这个产品?谁不会买?或者说:谁购买这个产品的可能性大,谁购买的可能性小。这样我们就可以瞄准可能性最高的一批人,他们就构成了我的目标市场。这就是我们通常所说的市场定位。令表示购买决定,那么影响它的因素有很多。比如,消费者自己的人口特征、消费者过去的购买记录是、来自社交网络朋友的行为信息、产品自己的特征、产品正在承受的市场手段策略(例如:促销)、竞争对手的市场动作等等。一.模型建立理论回归模型:其中。

3、注:称为优势(odds),表示某个事件的相对危险度.获得容量为的样本后可得样本回归模型:其中,。补充说明(1)逻辑回归模型的整个生成过程是以构造性的思想为主,而不是因为:上帝他老人家生成数据的真实机制是这样的,没有那么巧的事。(2)逻辑回归构造的核心思想是通过逻辑变换把0-1之间的概率变换为正负无穷之间的一个数字。给定一组数据,如果赶巧了,他能够被逻辑回归模型很好的拟合,那么相应的估计精度和预测精度都会很优秀。但是,绝大多数情况下,拟合效果跟上帝比,差得远,跟拍脑袋比,好很多。所以,这就成就了逻辑回归,作为一种最常见的0-1回归分析方法的重要地位。(

4、3)通过逻辑回归模型,我们可以对一个样本取值为1的概率予以测算,然后根据测算的概率预测它的最终取值应该是0还是1.(4)关于自变量类型自变量的常见类型:连续型变量、二水平的分类变量、多水平的分类变量、等级变量。多水平的分类变量:例如个体的血型、民族、职业、工种等等如何处理?产生哑变量,所谓哑变量就是一组取值1和0的二值分类变量,用来表示一个分类变量。例1为了了解冠心病与种族的关系,某研究所调查了100个个体,数据如下表。试估计各种族间患冠心病的相对危险度。(logistic3)冠心病黑人白人其他种族1020105202520等级变量:如文化程度如何处

5、理?一般以最小等级或最大等级为参考组,并按等级顺序依次取为0,1,2...例如对于变量年龄,令25-34=0;35-44=1;45-54=2;55-64=3;65-74=4;75+=5(5)关于因变量类型及模型两类结果:二值logistic回归(BinaryLogisticRegression)无序多分类:多类结果的logistic回归(MultinomialLogisticRegression)例:毕业去向---工作、读研、出国留学、待业有序多分类:有序结果的累积优势logistic回归、有序结果的相邻优势logistic回归。(OrdinalLo

6、gisticRegression)例:疾病严重程度---无、轻、中、重智商----弱智、正常、超常二.参数估计1.极大似然估计或者加权最小二乘估计2.系数解释从数学上来讲,与多重线形回归模型中系数的解释并无不同,即表示改变一个单位时的改变量。在实际中此改变量表示什么含义?请看例2。例2本例是探讨妇女使用雌激素与患子宫内膜癌的研究资料。使用未使用患病未患病5512819164资料的计算机输入格式结果变量(因变量)暴露因素(自变量)频数115501191012800164模型:回归常数的意义:当时,表示非暴露下的发病率与未发病率之比.若较小,,近似表示非

7、暴露下的发病率。回归系数的意义:由于自变量只取两个值,改变一个单位几位从0变到1.即(优势比)Logistic回归结果变量估计系数标准误差SEOR95%CI1.31070.29114.5030.0003.70892.0964—6.5615常数项-0.24780.1179-2.1010.036三、模型的检验与修改模型的拟合优度检验:似然比检验、Hosmer-Lemeshow检验对各变量显著性的检验:似然比检验(likelihoodratiotest)、Wald检验、比分检验(scoretest)四、Spss实现:以例2为例例2本例是探讨妇女使用雌激素与

8、患子宫内膜癌的研究资料。使用未使用患病55128未患病19164(1)录入数据点击variableview定

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。