欢迎来到天天文库
浏览记录
ID:36739124
大小:968.79 KB
页数:48页
时间:2019-05-14
《基于二级结构元素的蛋白质结构比对算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、华中科技大学硕士学位论文摘要蛋白质结构比对算法对于了解蛋白质进化关系、发现蛋白质折叠机理等具有重要作用,是生物信息学非常重要的研究方向之一。目前存在很多基于二级结构元素进行研究的比对算法,在比对运算的效费比方面具有优势,但比对性能还有很大的提升空间。本研究以简单有效的蛋白质结构叠合算法为基础,融合多个几何特征和疏水性特征,设计了结构相似性打分策略,用于二级结构元素的动态规划对齐。针对目前二级结构元素的评分方法无法很好兼顾残基对齐数目的问题,加入了对相似性评分的校正策略。在残基对齐步骤中,本研究也基于动态规划算法提出了解决方案,从残基的最近邻
2、居配对中直接抽取按升序对齐的子集,以降低得到局部最优结果的可能性。基于扩大相似性搜索空间的原则,本研究在二级结构对齐和残基对齐步骤的结合方式上做出了较大的改变,对于所有可能的初始坐标变换都进行彻底搜索,同时也采取了措施以保证算法运行的效率。在上面提出的几项改进基础上,本研究开发了结构比对软件SECS。用取自二级数据库FSSP和其他蛋白质相似性数据集的1054个蛋白质对SECS的测试结果显示,SECS在均方根偏差(RMSD)和残基对齐数目两项性能指标上对于著名同类算法LOCK2分别平均具有9.33%和2.60%的优势。关键词:蛋白质结构比对二
3、级结构元素校正函数动态规划搜索空间I华中科技大学硕士学位论文AbstractProteinstructurealignment,whichisvaluableforunderstandingtheevolutionaryrelationshipsbetweentheproteinsanddiscoveringthemechanismofproteinfolding,isoneofthemostimportantresearchissuesinbioinformatics.Manyalignmentalgorithmsbasedonsecon
4、darystructureelements(SSEs)havebeendeveloped,whichareadvancedincost-effectiveness,buttheperformanceofthesemethodsstillcanbeimproved.Inthisstudy,asimpleandeffectivesuperpositionalgorithmisusedasanelementarycomponent.Bycombiningseveralgeometricalfeaturesandthehydrophobicityc
5、haracteristic,astructuralsimilarityscoringstrategyisdesignedandusedinthedynamicprogrammingprocessofaligningtheSSEs.AimingattheproblemthatthescoringmethodcannotwellcombineSSEssimilaritywiththenumberofalignedresidues,acorrectionfunctionisjoinedwiththesimilarityscore.Inresidu
6、ealignmentprocess,amethodbasedondynamicprogrammingisusedtoextractasubsetwhichisalignedinascendingorderfromthenearest-neighborspairsofallresidues,reducingtheprobabilityofgainingalocaloptimizedresult.Ontheprincipleofexpandingthesearchspace,achangeismadeinthewayofcombiningSSE
7、sandresiduesalignmentprocesses.Allpossibleoriginaltransformationsbetweenstructuresaresearchedthoroughly.Meanwhile,measuresaretakentoguaranteetheefficiencyofthisalgorithm.AnewprogramSECSisdevelopedbasedontheimprovementsabove.Testingresultson1054proteinsfromdatabaseFSSPandot
8、hersimilaritydatasetsdemonstratethattheperformancesofSECShaveanaverage9.33%advantageinRMS
此文档下载收益归作者所有