基于特征挖掘与融合的剪接位点识别.pdf

基于特征挖掘与融合的剪接位点识别.pdf

ID:54367256

大小:223.11 KB

页数:6页

时间:2020-04-29

基于特征挖掘与融合的剪接位点识别.pdf_第1页
基于特征挖掘与融合的剪接位点识别.pdf_第2页
基于特征挖掘与融合的剪接位点识别.pdf_第3页
基于特征挖掘与融合的剪接位点识别.pdf_第4页
基于特征挖掘与融合的剪接位点识别.pdf_第5页
资源描述:

《基于特征挖掘与融合的剪接位点识别.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第34卷第1Z期华中科技大学学报自然科学版Vol.34No.1ZZ006年1Z月J.uazhongUniv.ofSci.Tech.NatureScienceEditionDec.Z006基于特征挖掘与融合的剪接位点识别周艳红王卉杨雷!华中科技大学生命科学与技术学院"湖北武汉430074#摘要!在基于保守序列这一信号特征识别剪接位点的基础上挖掘了可用于剪接位点识别的其他多个特征包括剪接位点上下游序列的碱基组成剪接位点信号和上下游序列的碱基组成随位点邻近序列C+G含量的变化等统计特征建立了描述这些特征的模型设计了能有效融合这些特征对剪接位点进行识别的对数线性模型开发了剪接位点识别程序Spl

2、icekey.测试结果表明Splicekey识别剪接位点的精度不仅较WAM方法有显著的提高而且也优于国际上最新发布的剪接位点识别软件DGSplice.Splicekey已提供网络服务http/infosci.hust.edu.cnSplicekey.关键词!剪接位点对数线性模型C+G含量权重阵列模型中图分类号!@756文献标识码!A文章编号!1671-451ZZ0061Z-0117-04IdentificationofsplicesitesbasedonfeatureminingandintegrationZhOuyanhOngWang~uiyangLeiCollegeofLifeSc

3、ienceandTechnologyuazhongUniversityofScienceandTechnologyWuhan430074ChinaAbstractBesidesthefeatureoftheconservativesignalseCuencesaroundsplicesitesotherfeaturesforidentifyingsplicesitesWereexploitedincludingtherelationshipbetWeentheconservativesignalsandtheC+GcontentofseCuencesaroundsplicesitest

4、hecompositionalfeaturesoftheupanddoWnstreamseCuencesofsplicesitesandtheirdependenceontheC+GcontentofseCuencesaroundsplicesites.Furtherdifferentmodelsareconstructedtodescribethesefeaturesandalogitlinearmodeliscreatedtointegratethem.EventuallyaneWprogramSplicekeyforthepredictionofsplicesitesisde-v

5、eloped.TestingresultsdemonstratethatthepredictionaccuracyofSplicekeyisnotonlysignificantlyhigherthanthatofWAMbutalsobetterthanthatofDGSplicearecentlyreleasedsplicesitepredic-tionprogram.Splicekeyisavailableathttp/infosci.hust.edu.cnSplicekey.KeywordssplicesitelogitlinearmodelC+GcontentWeightarra

6、ymodelWAM准确识别剪接位点从而精确定位基因外显子MORGAN等.然而保守序列这一信号特征并不的边界是真核生物基因结构预测中的难点和关键能涵盖剪接位点邻近序列的全部有效信息为进1问题之一.针对这一问题国际上已开展了大量一步提高剪接位点的识别精度尚需挖掘更多的Z~5有效特征.本研究在WAM方法的基础上进一的研究工作提出了多种预测模型和方法其中广泛使用的识别方法是基于剪接位点附近的保步挖掘了剪接位点邻近序列碱基组成特征引入守序列这一信号特征建立识别模型考虑了保守了根据剪接位点邻近序列的C+G含量不同进行序列信号位点间近程相关性的WAM被广泛用分类建模的策略设计了对数线性模型来融合各6

7、于基因结构预测系统中有GenekeyVEIL种特征模型开发了真核生物剪接位点预测软件收稿日期!Z005-1Z-14.作者简介!周艳红1966-男教授武汉华中科技大学生命科学与技术学院430074.E-mailyhzhou@hust.edu.cn基金项目!国家自然科学基金资助项目90Z0301130370354.118华中科技大学学报自然科学版第34卷Splicekey.体作为剪接活性的基本度量单位根据每个五联体在真假样本的上游邻近区域出现的频率

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。