基于二级结构元素的蛋白质结构比对算法

基于二级结构元素的蛋白质结构比对算法

ID:36739124

大小:968.79 KB

页数:48页

时间:2019-05-14

基于二级结构元素的蛋白质结构比对算法_第1页
基于二级结构元素的蛋白质结构比对算法_第2页
基于二级结构元素的蛋白质结构比对算法_第3页
基于二级结构元素的蛋白质结构比对算法_第4页
基于二级结构元素的蛋白质结构比对算法_第5页
资源描述:

《基于二级结构元素的蛋白质结构比对算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、华中科技大学硕士学位论文摘要蛋白质结构比对算法对于了解蛋白质进化关系、发现蛋白质折叠机理等具有重要作用,是生物信息学非常重要的研究方向之一。目前存在很多基于二级结构元素进行研究的比对算法,在比对运算的效费比方面具有优势,但比对性能还有很大的提升空间。本研究以简单有效的蛋白质结构叠合算法为基础,融合多个几何特征和疏水性特征,设计了结构相似性打分策略,用于二级结构元素的动态规划对齐。针对目前二级结构元素的评分方法无法很好兼顾残基对齐数目的问题,加入了对相似性评分的校正策略。在残基对齐步骤中,本研究也基于动态规划算法提出了解决方案,从残基的最近邻

2、居配对中直接抽取按升序对齐的子集,以降低得到局部最优结果的可能性。基于扩大相似性搜索空间的原则,本研究在二级结构对齐和残基对齐步骤的结合方式上做出了较大的改变,对于所有可能的初始坐标变换都进行彻底搜索,同时也采取了措施以保证算法运行的效率。在上面提出的几项改进基础上,本研究开发了结构比对软件SECS。用取自二级数据库FSSP和其他蛋白质相似性数据集的1054个蛋白质对SECS的测试结果显示,SECS在均方根偏差(RMSD)和残基对齐数目两项性能指标上对于著名同类算法LOCK2分别平均具有9.33%和2.60%的优势。关键词:蛋白质结构比对二

3、级结构元素校正函数动态规划搜索空间I华中科技大学硕士学位论文AbstractProteinstructurealignment,whichisvaluableforunderstandingtheevolutionaryrelationshipsbetweentheproteinsanddiscoveringthemechanismofproteinfolding,isoneofthemostimportantresearchissuesinbioinformatics.Manyalignmentalgorithmsbasedonsecon

4、darystructureelements(SSEs)havebeendeveloped,whichareadvancedincost-effectiveness,buttheperformanceofthesemethodsstillcanbeimproved.Inthisstudy,asimpleandeffectivesuperpositionalgorithmisusedasanelementarycomponent.Bycombiningseveralgeometricalfeaturesandthehydrophobicityc

5、haracteristic,astructuralsimilarityscoringstrategyisdesignedandusedinthedynamicprogrammingprocessofaligningtheSSEs.AimingattheproblemthatthescoringmethodcannotwellcombineSSEssimilaritywiththenumberofalignedresidues,acorrectionfunctionisjoinedwiththesimilarityscore.Inresidu

6、ealignmentprocess,amethodbasedondynamicprogrammingisusedtoextractasubsetwhichisalignedinascendingorderfromthenearest-neighborspairsofallresidues,reducingtheprobabilityofgainingalocaloptimizedresult.Ontheprincipleofexpandingthesearchspace,achangeismadeinthewayofcombiningSSE

7、sandresiduesalignmentprocesses.Allpossibleoriginaltransformationsbetweenstructuresaresearchedthoroughly.Meanwhile,measuresaretakentoguaranteetheefficiencyofthisalgorithm.AnewprogramSECSisdevelopedbasedontheimprovementsabove.Testingresultson1054proteinsfromdatabaseFSSPandot

8、hersimilaritydatasetsdemonstratethattheperformancesofSECShaveanaverage9.33%advantageinRMS

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。