生存分析censored data蒋磊磊

生存分析censored data蒋磊磊

ID:13255691

大小:355.32 KB

页数:16页

时间:2018-07-21

生存分析censored data蒋磊磊_第1页
生存分析censored data蒋磊磊_第2页
生存分析censored data蒋磊磊_第3页
生存分析censored data蒋磊磊_第4页
生存分析censored data蒋磊磊_第5页
资源描述:

《生存分析censored data蒋磊磊》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、肺癌患者病情及生存率等问题的分析(蒋磊磊,北京师范大学,数学科学学院,北京,100875)一:实验内容及数据来源本次实验的数据使用的是137位肺癌病情的治疗数据,变量id是患者编号;therapy是治疗方案,1表示标准方法,2表示试验方法;cell是肺癌细胞组织学分类,1表示磷癌,2表示小细胞肺癌,3表示腺癌,4表示大细胞癌;time是生存时间;status是病人状态,0表示死亡,1表示缺失数据;kps是判断标准,小于30表示的是住院治疗,30到60之间表示住院和家庭结合治疗,大于60表示家庭治疗;dia

2、gtime是诊断到治疗时间;age是年龄;prior是治疗前的处理状态,0表示经过处理,1表示未经处理.数据如下二:生存率估计生存率估计方法有参数法和非参数法两类.参数法是根据专业知识和实际问题本身的特性或应用一定的统计手段选择特定的生存时间分布形式(如前面提到的指数分布、Weibull分布、对数正态分布等)拟合实际资料,求得特定分布中的参数,以此来描述生存和死亡规律.这种方法计算较为复杂.大量资料是采用非参数估计.如乘积限和寿命表法由于是没有分组,所以本题采用KM也叫做乘积限法非参数法对肺癌患者进行医学

3、研究.根据样本含量的大小可分别选择寿命表法或乘积限估计法.图1从图1中可以看出中位肺癌的生存期处于80个月.它的标准差为15.721.图2图2可以看出,随着时间的推移,肺癌患者的生存率越来越低.肺癌患者从刚开始生存率逐渐下降,知道400个月是下降趋势减缓.随着有可能死亡.图3图3为1减去累计生存函数后的后的生存率.和图3正好相反图4通过对数生存函数更能直观地看出肺癌患者下降趋势的陡峭程度.图5通过图5,我们可以清楚地看出,随着时间的推移,肺癌患者的累积危险越来越高,随时有死亡的风险,在刚开始的时间,呈直线

4、上升趋势,但是一定时间后,我们可以发现上升趋势缓慢.这是由于等到了肺癌晚后期,生存率几乎为0了,所以此刻生息率非常高了.上升的幅度不大了.三:对数秩和检验之前我们已经讨论了生存率的大体情况.但是此时有两种不同的治疗方案.一种是标准方法治疗,一种是试验方法治疗.作为医生,肯定要考察这两种方法在临床肺癌治疗上是否有显著性.于是,我们采用对数秩和检验.当然这里还有其他方法来检验两者的显著性.图6图6给出了两者的均值估计以及中位数估计.图7图7的结果显示通过对数秩和检验发现,利用标准疗法以及试验疗法在肺癌的生存率

5、并不显著.也就是希望医生能够对试验疗法进行改进.图8从图8看出来,从开始到最后的时间当中两者的差异并不明显.尤其在0到20这个区间内累计生存率基本一样.到之后发现标准比试验对肺癌患者的生存率有显著增加.但是在交点之后,试验方法的生存率高于标准方法的累计生存率.图9图9清晰地看出两者忽高忽低.不能说两种方法孰优孰劣.只能说在不同时间,有不同的优势.图10图10给出的是1减去累计生存函数.图11生息率的高低可以从图11看出.在200之前,试验方法的生息率高于标准方法的生息率.但是当高于200之后,两者反过来了

6、.标准方法的生息率说明在最后肺癌患者随时都有死亡的风险.三.COX回归模型在比例风险模型中,假设在时点t个体出现观察结局的风险大小可以分解为两个部分,除了有一个基本的风险量h0(t)外,第i个影响因素使得该风险量从h0(t)增至eβixi倍而成为h0(t)eβixi,如果在k个因素同时影响生存过程的情况下,在时点t的风险量(也称为风险率或者风险函数)就为:ht=h0teβ1x1eβ2x2…eβkxk所以比例风险模型的基本结构如下:ht,x=h0teβ1x1+β2x2+…βkxk将基础风险以至公式左侧,两边

7、同取对数,得到:logRht=loght,Xh0t=β1x1+β2x2+…βkxk从上式可见β的实际含义是:当变量X改变一个单位时,引起的死亡风险改变倍数的自然对数值.这就是风险比例模型,也成为Cox回归模型.图12图13图14图15图16图17图18是对观测量处理的说明,即读入观测量总数、带有缺失值的观测量、带有负生存时间变量的观测量、在分层中缺失观测量、去除的观测量总数、用于统计分析的观测量.图19是对个变量值进行编码分类,cell为分类变量,以该变量中的第一分类(即squamous)作为参照分类对比

8、,(1)代表small分类,(2)代表adeno分类,(3)代表large分类.图18图19图20和图21给出了模型系数的检验结果,图20给出了原始的对数似然值1011.768,对于图21,其中因变量为time,128个未剔除观测量,9个剔除观测量,使用向后消去回归和沃德检验,显示每步的变化和每步协变量组的变化.第一步进入模型的变量,第二步cell变量进入模型,没有其他变量进入或剔除模型,这时对数似然值为950.359,总体记

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。