基于R的有序分类资料logistic回归分析

基于R的有序分类资料logistic回归分析

ID:38229295

大小:1.27 MB

页数:4页

时间:2019-05-25

基于R的有序分类资料logistic回归分析_第1页
基于R的有序分类资料logistic回归分析_第2页
基于R的有序分类资料logistic回归分析_第3页
基于R的有序分类资料logistic回归分析_第4页
资源描述:

《基于R的有序分类资料logistic回归分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、软件2014年第35卷第6期设计研究与应用基于R的有序分类资料logistic回归分析韦杰,曾萍(贵阳中医学院基础医学院,贵州贵阳,550002)摘 要:本文描述有序分类资料的logistic回归模型及参数估计与假设检验,以R语言作为分析工具,利用程序包MASS中的polr函数对数据文件进行回归系数的估计及模型拟合检验,从而完成统计推断。关键词:有序分类;logistic回归模型;R语言中图分类号:O212.1      文献标识码:A      DOI:10.3969/j.issn.1003-6970.2014.06.015本文著录格式:[1]韦杰,曾萍

2、.基于R的有序分类资料logistic回归分析[J].软件,2014,35(6):56-57TheLogisticRegressionwereUsedtoAnalyzeOrdinalDataonRLanguageWEIJie,ZENGPing(GuiYangCollegeofTraditionalChineseMedicine&BasicMedicalDepartmentGuiZhouGuiYang550002)【Abstract】ThisarticledescribestheOrdinaldatafoundedlogisticregressionmode

3、l,parameterestimationandhypoth-esistesting;UsingRlanguageastheanalysistool,thedatawereanalyzedbyestimationofregressioncoefficientandModelfittingtestusingPolrfunctioninMASSpackage,thusfinishedthestatisticalinference.【Keywords】Ordinaldata;logisticregressionmodel;Rlanguage0 引言线性回归模型在定量分

4、析的实际研究中也许是最流行的统计分析方法,然而在许多情况下,当反应变量是一个分[1]类变量而不是一个连续变量,这时候线性回归就不适用了,此时可以采用logistic回归分析。logistic回归是一种研究[2]两水平或多水平的反应变量与影响因素间曲线关系的回归分析。logistic回归的反应变量(因变量)可以是二分类的,也可以是多分类的,二分类的情况具有一般性,但在实际中也可能会遇到多分类的情况。多分类logistic回归模型又可以分成两种不同的情况,第一种为反应变量是无序分类资料,如血型分为:A型、B型、AB型、O型;第二种为反应变量是有序分类资料(等级

5、资料),如疗效分为:痊愈、显效、微效、无效。当反应变量是有序分类资料时,对数据采用有序分类logistic回归模型进行分析。1 有序分类logistic回归模型下面用实例来描述该模型,数据见表1,设反应变量疗效(Y)为不同治疗方法治疗某病的效果,它有3个类别,p1、p2、p3分别表示疗效为显效、有效、无效的概率,且满足p1+p2+p3=1。模型中有2个自变量,它们分别是性别(x1)与治疗方法(x2),建立有序分类logistic回归模型为:其中,αi和βi(i=1,2)分别表示模型中的截距和回归系数。若反应变量中有K个类别,有序分类logistic回归模型

6、中就有K-1个logit模型,所以K=3时,就有2个logit模型,从有序分类logistic回归模型得到:eα1+β1x1+β2x2eα2+β1x1+β2x2eα1+β1x1+β2x2p=,p=−,p3=1-p1-p211+eα1+β1x1+β2x221+eα2+β1x1+β2x21+eα1+β1x1+β2x2作者简介:韦杰(1979-),男,讲师,硕士,主要研究方向为应用统计及非参数检验。软件杂志欢迎推荐投稿:cosoft@163.com56韦杰,曾萍:基于R的有序分类资料logistic回归分析2 参数估计与检验对于logistic回归模型的分析需要

7、根据样本数据,求出回归模型中截距和各个自变量的回归系数,通常采用最大似然法求出回归系数的估计值,当求出回归系数后要对回归系数进行检验,并建立回归方程,以此来描述反应变量与自变量之间的关系。回归系数的检验方法主要有似然比检验,检验目的是检验总体回归系数是否为零,该法通过比较有嵌套关系的两个模型的对数似然函数变化所进行的,其检验统计量G=-2ln(L2/L1),其中L1为所设定原模型的最大似然函数的对数,L2为简化模型的最大似然函数的对数,在大样本时,G近似地服从自由度为省略自变量个数的卡方分布。logistic回归模型的拟合检验是通过比较模型预测数和实际观测

8、数有无差别来进行检验,如果预测的值与实际观测的值越接近,说明模型的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。