癌症发展分期的生物组学标志物检测算法研究

癌症发展分期的生物组学标志物检测算法研究

ID:37064742

大小:5.16 MB

页数:89页

时间:2019-05-17

癌症发展分期的生物组学标志物检测算法研究_第1页
癌症发展分期的生物组学标志物检测算法研究_第2页
癌症发展分期的生物组学标志物检测算法研究_第3页
癌症发展分期的生物组学标志物检测算法研究_第4页
癌症发展分期的生物组学标志物检测算法研究_第5页
资源描述:

《癌症发展分期的生物组学标志物检测算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、—————————————————————癌症发展分期的生物组学标志物检测算法研究—————————————————————ResearchofCancerProgressionStageOmicsBiomarkersDetectionAlgorithms————————————作者姓名:任艳姣专业名称:计算机科学与技术(生物信息学)研究方向:计算生物学指导教师:徐鹰教授学位类别:学术学位博士培养单位:计算机科学与技术学院论文答辩日期:2018年06月05日授予学位日期:2018年月日论文评阅人:答辩委员会

2、组成:姓名职称工作单位姓名职称工作单位盲审专家正高级中国科学院空间应用工程与技术中心主席许东教授密苏里大学盲审专家正高级重庆大学委员马志强教授东北师范大学盲审专家正高级厦门大学梁艳春教授吉林大学欧阳继红教授吉林大学欧阳丹彤教授吉林大学刘磊教授吉林大学宫雷光教授吉林大学摘要癌症发展分期的生物组学标志物检测算法研究癌症是当今人类健康的杀手之一,到目前为止,世界上并没有完全根治癌症的方法,临床上仅仅从治疗和预后来检验一个癌症患者的治愈程度。评价预后的指标有两个:一个是五年生存率,一个是死亡率。癌症的分期简单来说就

3、是癌症的浸染和扩散程度,世界上普遍将癌症分为四个分期;一般来说I期和II期属于早期,治疗后痊愈的机会大,III期和IV期属于晚期,五年生存率较低。随着人类基因组计划的实施和生物大数据的蓬勃发展,人们对于肿瘤的分子生物学认识从基因组层面扩展到了蛋白质组学、表观组学等多个组学层面,在多组学数据上应用分类算法将早期和晚期的样本进行有效的区分,从而找到更多有效的生物标记物,可以促进癌症的基因靶向治疗,同时为处在瓶颈的放化疗、免疫治疗、手术等医学手段带来了希望,多组学数据的算法研究将会为肿瘤的治疗技术提供更多的可能性

4、。统计机器学习的一般过程,首先是用机器学习算法对生物大数据进行学习建模,然后优化模型,最后通过模型对数据进行分析和预测。文中用到的生物大数据包括基因组、蛋白质组和表观组学数据。在测序技术允许的条件下,进行多组学数据多层次的交叉分析和研究,会对肿瘤的认识更加具体,更能筛选出有用的肿瘤标志物。肿瘤标志物的预测和发现是统计机器学习的研究热点问题,主要采用的就是特征选择和分类回归等算法。本文通过对肿瘤的三种组学数据进行一系列相关的统计和机器学习算法的研究,旨在找到更加有效和准确的肿瘤分期标志物,从而对临床治疗方案提

5、供指导依据,进一步改善预后提高生存率。肺癌是当今世界上最普遍的癌症,根据最新统计,肺癌致死率占所有癌症的榜首。可以说肺癌是最有代表性的癌症之一,这是我们最先选择肺癌作为研究对象的原因。肺癌的治疗近年来有了很大的进步,但是临床预后仍然不理想,据统计复发率为15%-30%,5年生存率为60%-70%。肺腺癌(LUAD)和肺鳞状细胞癌(LUSC)是肺癌的两大主要亚型。如果在早期得到正确的诊断和适当的治疗,肺癌患者会大大提高生存率并且少遭受很多的痛苦。文中对这两种肺癌亚型进行了全面的蛋I白质生物标志物的筛选,这些标

6、志物可以用来预测肺癌的发展分期。首先我们将蛋白质组学数据进行均值为0方差为1的标准化预处理,然后采用特征选择算法SVM-RFE筛选候选标志物,最后采用后向k个特征搜索过程对冗余的特征进一步优化,得到如下结果:肺腺癌三分类识别模型用了28个蛋白生物标志物达到了86.51%的分类准确率,肺鳞状细胞癌三分类识别模型用了41个蛋白生物标志物达到了89.47%的分类准确率。研究发现有5个蛋白标志物均出现在肺腺癌和肺鳞状细胞癌的模型中。转录组数据模型在肺腺癌和肺鳞状细胞癌的三分类识别模型中分别用了34个和38个转录标志

7、物,分别达到了99.2%和100%的三分类准确率。本文也对甲基化组数据进行了建模,模型在肺腺癌和肺鳞状细胞癌的三分类识别模型中分别用了43个和36个甲基化标志物,达到了93%和89%的三分类准确率。通过以上两种组学数据的对照实验,说明文中提出的蛋白标志物对于肿瘤分期的预测具有很好的辨识能力,并且随着大规模蛋白质组测序技术的进步,将会有更多有用的信息被挖掘出来。肾癌是泌尿系统最常见的恶性肿瘤之一。近些年来,肾癌的发病率和致死率呈现逐年升高的趋势。最近有研究表明,靶向治疗可以将肾癌患者生存期延长至50个月。甲基

8、化的过程是可逆的,所以他是基因表达的开关。甲基化位点可以作为靶向治疗的靶点进行肿瘤的预防和治疗,所以针对甲基化组数据的研究十分必要。研究肾癌分期标志物可以辅助医生针对不同的病人提出具体的治疗方案,并且可以得到具有统计意义的甲基化位点,对临床和靶向用药具有十分重要的指导意义。将上个研究的机器学习算法应用在甲基化组数据集上效果并不理想,仅仅达到最高76.46%的分类准确率,通过对于肾癌的特异性分析,本文中提出了一种基

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。