定类或定序因变量回归分析.ppt

定类或定序因变量回归分析.ppt

ID:58363418

大小:560.50 KB

页数:31页

时间:2020-09-07

定类或定序因变量回归分析.ppt_第1页
定类或定序因变量回归分析.ppt_第2页
定类或定序因变量回归分析.ppt_第3页
定类或定序因变量回归分析.ppt_第4页
定类或定序因变量回归分析.ppt_第5页
资源描述:

《定类或定序因变量回归分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第十讲定类或定序因变量回归分析当因变量是一个定类变量而不是定距变量时,线性回归模型受到挑战。如政治学中研究是否选举某候选人,经济学研究中涉及的是否销售或购买某种商品,社会学和人口学研究中所涉及的如犯罪、迁移、婚姻、生育、患病等等都可以按照二分类变量或多分类来测量。一、问题的提出在研究态度与偏好等心理现象时也经常按类型进行测量的,如“强烈反对”、“反对”、“中立”、“支持”、和“强烈支持”。连续变量转换成类型变量的情形,如在分析升学考试的影响因素时,将考生分为录取线以上和录取线以下。从统计理论上看,最小二乘法关注正态分布,然而社会经济现象往往有不同于正态分布的其他分布,例如:(1)二项分布(b

2、inomialdistribution)(2)泊松分布(Poisson)二、线性概率模型1、模型建立以最小二乘法为基础的线性回归方程是估测因变量的平均值,而二分变量的均值有一个特定的意义,即概率。用普通线性回归方程估测概率,就是所谓的线性概率回归。用公式表示为:P=a+∑βiXi+ε对二项分布线性概率模型的结果解释:在其他变量不变的情形下,x每增加一个单位,事件发生概率的期望将变动β个单位。例如,林楠和谢文(1988)曾用线性概率模型估测入党(政治资本)的概率,模型为:P=-0.39+0.01A+0.04E+0.03U其中:P—党员概率,A—年龄,E—受教育年限,U—单位身份1)无意义的解释

3、从解释力上看,由于概率的值是有边界的,在0与1之间。但林楠方程很有可能要超过该限制,因变量的估计值可能是负数,也可能大于1,因此模型的结果是无意义的。例如,运用林楠方程,我们发现如果年龄为100岁,受教育程度超过10年,则入党的概率约等于1。2)非线性关系2、线性概率模型存在的问题三、简单对数比率回归1、模型建立既然用线性概率回归存在局限性,能否用比率做因变量呢?比如用男女比率作因变量,用成功与不成功之比做因变量。用比率做因变量存在的问题是,比率是非对称的.表1概率、比率和对数比率概率0.010.100.200.300.400.500.600.700.800.900.99比率0.010.11

4、0.250.430.671.001.502.334.009.0099对数比率-4.60-2.20-1.39-0.85-0.410.000.410.851.392.204.60一个简单的解决办法就是取对数,结果就是所谓对数比率(logit)。若用P代表某事件的概率,则对数比率函数的定义为g(P)=log(P/1-P)以对数比率为因变量对自变量X1,X2,X3……做回归称为对数比率回归(logisticregression),其方程式为:该模型即为logit回归模型。logit回归模型是普通多元线性回归模型的推广,但它的误差项服从二项分布,因此需要采用极大似然估计方法进行参数估计,参数称为lo

5、git回归系数,表示当其他自变量取值保持不变时,该自变量取值增加一个单位引起的发生比自然对数值的变化量。2、发生比发生比是事件的发生频数与不发生频数之间的比,即:Odds=(事件发生频数)/(事件不发生频数)当比值大于1时,表明事件更有可能发生。比如一个事件发生的概率为0.6,事件不发生的概率为0.4,发生比等于0.6/0.4=1.5。事件发生的可能性是不发生的1.5倍。四、logistic回归模型的检验与评价1、Logistic回归模型估计的假设前提第一、数据来自于随机样本。第二、因变量Yi被假设为K个自变量Xk(k=1,2,…,K)的函数。第三、正如OLS回归,logistic回归也对多

6、重共线性有所限制,自变量之间存在多重共线性会导致标准误的膨胀。Logistic回归模型还有一些与OLS回归不同的假设前提:第一,因变量是二分变量;第二,因变量和各自变量之间的关系是非线性的。2、拟合优度检验如果模型的预测值能够与对应的观测值有较高的一致性,就认为这一模型能够拟合数据。否则需要对模型重新设置。因此,模型的拟合优度是指预测值与观测值的匹配程度。检验拟合优度的指标有皮尔逊卡方检验、对数似然比卡方检验等。1)皮尔逊卡方检验皮尔逊卡方检验主要用于检验残差项的大小。计算公式:其中yi是观察值(0或1),pi是估算值的概率,i=1,2…n,分母是估算值的标准差,自由度为n-J-1,其中J为

7、自变量数目。2)Hosmer-Lemeshow拟合优度检验该方法通常适用于自变量很多,或自变量为连续变量的情形。HL方法根据预测概率的大小将所有观察单位十等分,然后根据每一组中因变量的实际值与理论值计算Peason卡方,其统计量为:其中G代表分组数,且G10;ng为第g组中的观测值数;yg第g组事件的观测数量;pg为第g组的预测事件概率;ngpg为事件的预测值,实际上它等于第g组的观测概率和。3)对数似然比

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。