随机森林算法及其在代谢指纹图谱中的应用研究

随机森林算法及其在代谢指纹图谱中的应用研究

ID:37396116

大小:12.36 MB

页数:56页

时间:2019-05-23

随机森林算法及其在代谢指纹图谱中的应用研究_第1页
随机森林算法及其在代谢指纹图谱中的应用研究_第2页
随机森林算法及其在代谢指纹图谱中的应用研究_第3页
随机森林算法及其在代谢指纹图谱中的应用研究_第4页
随机森林算法及其在代谢指纹图谱中的应用研究_第5页
资源描述:

《随机森林算法及其在代谢指纹图谱中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中图分类号——UDC540硕士学位论文学校代码!Q533密级坌珏随机森林算法及其在代谢指纹图谱中的应用研究RandomForestsAlgorithmStudyanditsApplicationintheMetabolicFingerprints作者姓名:学科专业:研究方向:学院(系、所):指导教师:吴清华分析化学随机森林在代谢指纹图谱中的应用化学化工学院中药现代化研究中心梁逸曾教授论文答辩日期地血。答辩委员会主席础中南大学2013年5月原创性声明IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIY2426229本人

2、声明,所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。作者签名:。量遗垒日期:缝年鲨月童日学位论文版权使用授权书本人了解中南大学有关保留、使用学位论文的规定,即:学校有权保留学位论文并根据国家或湖南省有关部门规定送交学位论文,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以采用

3、复印、缩印或其它手段保存学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。作者签名:呈速玺导师日期:业年丛月4日随机森林算法及其在代谢指纹图谱中的应用研究摘要:代谢组学作为一种新发展起来的系统生物学分支学科,研究的是生物机体内或是细胞组织系统内的动态代谢变化。糖尿病动物模型的代谢组学研究,对探究糖尿病及其并发症等的发病机制、降糖药的药理疗效以及及早发现并预防糖尿病,均具有十分重要的现实意义。本文重点研究随机森林算法在代谢指纹图谱中的应用,主要内容如下:一、基于

4、C57BL/6J小鼠和经诺和龙/罗格列酮治疗的不同周期的糖尿病KK—ay小鼠的尿液样本中小分子内源性代谢产物的定性定量信息,采用随机森林算法(RF)构建了糖尿病小鼠经其治疗后的代谢轨迹模型图,并经过树数目的选择、相似度矩阵、多维尺度变换等处理,获得不同组类小鼠的聚类信息,以及糖尿病小鼠经降糖药治疗后的不同周期的代谢变化轨迹。继而通过分析随机森林中变量重要度筛选出的代谢物,探究诺和龙/罗格列酮治疗糖尿病的机理及疗效。结果表明随机森林较之主成分分析(PCA)能得到更好的聚类信息,并能使其治疗的代谢轨迹清晰可视化。且模型中糖尿病小鼠逐

5、渐向健康小鼠靠拢,也即经诺和龙/罗格列酮治疗后,其能很好调节血糖、多元醇以及有机酸,糖尿病小鼠的代谢模式逐渐转向健康小鼠。二、基于C57BL/6J(雄性和雌性)小鼠和AMPKa2.KO(雄性和雌性)小鼠的尿液样本中小分子代谢物的定性定量信息,采用随机森林得到四类小鼠间明显的聚类信息。同样运用其重要变量度筛选出不同组类小鼠中的重要内源代谢物。以此分析AMPK基因对生物机体内物质代谢的影响,并探讨了其对不同性3,Jd,鼠的代谢模式的不同影响。为进一步研究糖尿病的影响因素及致病机理提供了一定的依据。以上研究可以表明,采用随机森林算法分

6、析代谢指纹图谱可以得到很好的聚类信息以及发掘其中潜在的重要生物标记物,其为进一步综合分析研究药物疗效、基因对疾病的影响提供了有理有力的依据。图20幅,表5个,参考文献91篇。关键词:随机森林;代谢轨迹;生物标记物;多维尺度变换分类号:RandomforestsalgorithmanditsApplicationintheMetabolicFingerprintsAbstract:Metabolomicsasanewsystemdevelopedbranchofbiology,itsstudiedcontentsaretheind

7、exesofstudiedgroupsandthedynamicmetaboliteschangeoftissueandcellsystemorthewholelivingorganisms.Asthedevelopmentofhigh—throughputanalyticaltechnologiesinmetabolomicsstudies,largeamountsofhighlycomplexdatahavebeengenerated.Sophisticatedcomputmionalapproachesarerequire

8、dtoextractandinterprettheinformationhiddenincomplex‘omics’data.Thispaperfocusesontherandomforestsanditsapplicationinthemetabolicfin

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。