基于机器学习方法的可变剪接位点预测研究.pdf

基于机器学习方法的可变剪接位点预测研究.pdf

ID:50160828

大小:7.13 MB

页数:56页

时间:2020-03-08

基于机器学习方法的可变剪接位点预测研究.pdf_第1页
基于机器学习方法的可变剪接位点预测研究.pdf_第2页
基于机器学习方法的可变剪接位点预测研究.pdf_第3页
基于机器学习方法的可变剪接位点预测研究.pdf_第4页
基于机器学习方法的可变剪接位点预测研究.pdf_第5页
资源描述:

《基于机器学习方法的可变剪接位点预测研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号密级■编号泰擘碛士所究嗲像讼式题目基于机器学习方法的可变剪接位点预测研究学院(所、中心)软件学皖专业名称软件工程(工学)研究生姓名郭倩含学号导师姓名姚绍女职称教授年月论文独创性声明及使用授权本论文是作者在导师指导下取得的研宄成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研宄成果,不存在剽窃或抄袭行为。与作者一同工作的同志对本研宄所做的任何贡献均已在论文中作了明确的说明并表示了谢意。现就论文的使用对云南大学授权如下:学校有权保留本论文(含电子版),也可以采用影印、缩印或其他复制手段保存论

2、文;学校有权公布论文的全部或部分内容,可以将论文用于查阅或借阅服务;学校有权向有关机构送交学位论文用于学术规范审查、社会监督或评奖;学校有权将学位论文的全部或部分内容录入有关数据库用于检索服务。内部或保密的论文在解密后应遵循此规定)研究生签名:导师签名:种认(日期:摘要摘要生物信息学的主要目标之一就是针对基因组表达与功能的研究分析,而真核生物剪接机制是细胞中影响基因表达的复杂过程,剪接机制在领域的研宄中具有重要意义。剪接机制的不同会产生不同的剪接产物,为了预测其剪接位点,就需要提出更精确的方法来解决相关的问题。机器学习是智

3、能计算领域的重要研宄点。不同与数据挖掘技术,除了对知识进行学习外,机器学习还被要求能够利用已有的知识来改善自身性能。利用机器学习方法来进行剪接位点的相关研宄,势必比传统的方法和工具更智能,预测结果更准确。本文主要研究的是结合二阶马尔可夫模型与支持向量机的机器学习方法在可变剪接位点预测问题上的应用,其思想是把对剪接位点的预测转化为根据其附近序列特征进行真假位点的分类。本文主要工作有:、从与可变剪接数据库中选择数据,从中挑出五种可变剪接序列的数据集,并在剪接位点上下游各取一定长度的碱基,组建样本数据并做预处理。、利用基于二阶马

4、尔可夫模型的方法进行序列特征抽取,通过分析从中选择出剪接位点二联碱基规则等主要特征,用于构成后续分类工作的特征向量。、利用改进了样本密集度和隶属度计算的进行分类,目的是尽量减少噪声样本对预测结果准确性的负面影响。通过测试表明,在针对可变剪接各变体位点的预测中,本文采用的预测方法比传统的算法和基本的机器学习方法的预测准确性更高,效果更好。关键词:可变剪接;剪接位点预测;特征分析;马尔可夫模型;支持向量机AbstractAbstractTheresearchongenomeexpressionandfunctionisoneo

5、fthemaingoalofbioinformatics.EukaryoticRNAsplicingmechanismisacomplicatedprocesswhichmayaffectthegeneexpression.SplicingmechanismisofgreatsignificanceintheresearchofRNA.Diferentsplicingprocesswillleaddiverseproducts.Inordertopredictthesplicesites,,、,、,、,Abstractsp

6、licingsites,themethodusedinthisarticleachievesabeterperformanceofpredictionaccuracythanthetraditionalalgorithmsandsimplemachinelearningmethods.Keywords:目录目录觀录表目录第一章引言课题研宄背景课题研宄现状本文研宄意义与工作论文组织结构第二章生物学基础生物序列与遗传信息传递与基因突变测序技术的可变剪接机制常规顺式剪接可变剪接类型反向剪接预测剪接点的工具第三章机器学习方法机器学

7、习概述机器学习统计学习马尔可夫模型支持向量机理论线性分类非线性分类核函数方法训练算法分类第四章预测可变剪接位点的方法研究4.1实现框架数据集选取训练集与测试集样本的预处理序列特征分析基于的特征提取剪接变体位点长度分析剪接位点二联碱基特征核酸序列值剪接位点的识别模型基于的改进预测算法决策函数密集度与隶属度第五章测试与分析评价指标分析预测结果的衡量指标曲线预测结果分析剪接位点的预测结果不同方法识别效果比较第六章总结与展望工作总结工作展望参考文献蘭目录图目录图的组成图碱基突变的类型图剪接过程产生的剪接点图可变剪接的产物图产生环形

8、的特殊剪接机制图马尔可夫模型图线性分类问题图非线性分类问题图根据特定函数在升维空间中的分类图预测可变剪接位点的实现流程图示图碱基的状态转移图各可变剪接类型的长度分布图图各可变剪接值对照图图供体位点模型图受体位点模型图本文使用的评价指标图外显子跳跃供体位点预测结果对比图外显子跳跃受体位点预测结果对比表目录

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。