基于支持向量机的蛋白质相互作用研究

基于支持向量机的蛋白质相互作用研究

ID:36832129

大小:3.35 MB

页数:66页

时间:2019-05-16

基于支持向量机的蛋白质相互作用研究_第1页
基于支持向量机的蛋白质相互作用研究_第2页
基于支持向量机的蛋白质相互作用研究_第3页
基于支持向量机的蛋白质相互作用研究_第4页
基于支持向量机的蛋白质相互作用研究_第5页
资源描述:

《基于支持向量机的蛋白质相互作用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、上海大学硕士学位论文摘要生物体系的运作与蛋白质之间的相互作用密不可分,DNA合成、基因转录激活以及信息传导等重要的生命活动均涉及到蛋白质。蛋白质.蛋白质相互作用是生物调控的基本单元,是实现生物体功能的基础。了解蛋白质的本质,结构以及相互作用方式对于研究疾病作用机理以及药物设计和开发具有重要意义。本文采用支持向量机(SupportVectorMachine,SVM)方法进行蛋白质相互作用预测。首先进行序列比对研究和二级结构预测,分析讨论序列比对和二级结构预测的影响因素。在预测蛋白质二级结构的过程中,利用疏水标

2、度和PSI-BLAST多序列比对改进FDOD(FunctionofDegreeofDisagreemen)算法使结果比原算法提高了3.5个百分点,降低了计算量。其次,进行蛋白质相互作用预测研究。从DIP数据库中下载得到蛋白质相互作用的数据,筛选出实验所需的正集数据17000对,利用随机组合构建负集数据17000对。将改进的FDOD算法进行二级结构预测的结果与其他氨基酸物理化学特性组成特征向量进行蛋白质相互作用预测,每对蛋白质对由组成、转换、分布的方式表示为278维的特征向量,预测准确率达到75.86%。为了

3、考虑周围环境对氨基酸的影响,又采用仅基于序列信息的方法进行相互作用预测。根据蛋白质偶极作用和侧链体积大小将20种氨基酸分为7类,以相邻的3个氨基酸片段为单位,计算每种片段在序列中出现的概率,将每个蛋白质对表示为686维特征向量,预测准确率达到79.63%。最后,比较上述两种方法的优缺点,提出将两种方法结合的改进算法。去掉氨基酸物理化学特性中的不确定因素,利用FDOD函数计算序列片段分布的数值来代替二级结构特性和溶解特性两个预测量,使每个蛋白质对特征向量的维数减小到212维,采用支持向量机进行预测,预测准确率

4、、精确度、敏感性分别达到:83.72%,84.67%,82.15%,与目前国内外先进方法得到的预测结果相接近,证明了改进方法的有效性。V上海大学硕士学位论文关键词:蛋白质相互作用预测、支持向量机、机器学习VI上海大学硕士学位论文ABSTRACTTheoperationofbiologicalsystcmiScloselyrelatedtotheprotein.proteininteractions.A11oftheimportantlireactivitiesincludingDNAsynthesis.ge

5、netranscriptionactivationandsignaltransductionareinvolvedinproteins.Protein-proteininteractionisthebasicunitofbiologicalcontrolandthebasisofachievingbiologicalfunction.Understandingthenatureandthestructureofproteinandthewayofinteractionisofgreatsignificanc

6、eforthemechanismresearchofdiseasesanddrugdesignanddevelopment.IIlt11iSthesis,themethodofSupportVectorMachine(SVM)Wasusedforpredictingprotein—proteininteraction.Firstsequencealignmentandsecondarystructurepredictionwerestudyed.Theimpactfactorsofsequencealign

7、mentandsecondarystructurepredictionwereanalyzedanddiscussed.TheimprovedmethodofFunctionofDegreeofDisagreemen(FDOD)algorithmWasusedtopredictproteinsecondarystructure.Thehydrophobicvalueswereappliedtoreducethecomputationandthesequencemultiplealignmentprogram

8、mePSI.BLASTWasusedtoimprovetheaccuracyrate.TheresultWasenhenced3.5percentagepointsthalltheoriginalalgorithm.Second.protein.proteininteractinspredictionwascarried.Theprotein-proteininteractionpairsweredownload

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。