基于统计建模方法的蛋白质结构预测研究

基于统计建模方法的蛋白质结构预测研究

ID:36456768

大小:2.91 MB

页数:111页

时间:2019-05-10

基于统计建模方法的蛋白质结构预测研究_第1页
基于统计建模方法的蛋白质结构预测研究_第2页
基于统计建模方法的蛋白质结构预测研究_第3页
基于统计建模方法的蛋白质结构预测研究_第4页
基于统计建模方法的蛋白质结构预测研究_第5页
资源描述:

《基于统计建模方法的蛋白质结构预测研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国科学技术大学博士学位论文基于统计建模方法的蛋白质结构预测研究姓名:王明会申请学位级别:博士专业:生物医学工程指导教师:冯焕清20060501基于统计建模方b'f19生I'i质结构预测研究摘婴Markov链方法对蛋白可溶性的整体预测结果好丁基丁神}经网络和信息论的方法。其中,对两类数据的最优分类结果达到78.9%,对=类数据的最优分类结果达到677%,表明高阶Ⅵarkc)v链模型(MCM)足蛋白残基可溶性预测的一科唷效方法。3蛋白质要参’,正常的生命活动,必须处于特定的细胞内医域(如细胞核、线粒体、细胞质等),而

2、预测蛋白质的亚细胞定位信息刈于了解其功能有重要的意义。本文选择了氨基酸组成、氨基酸对组成、位置特异性打分矩阵等不同特征以及模糊k近邻和支持向量机两种分类方法,对预测结果进行了比较和分析。结果表明位置特异性打分矩阵能提高对不同亚细胞位点的町区分性,是一种非常有效的分类特征,而支持向量机可以更好地利用位置特异性打分矩阵特征进行预测,因此采用氨基姨组成和位置特异性打分矩阵两种特征,并结合支持向量机,是种有效的弧绌胞定位预测方法。此外,还在此基础上提出了一种能进一步提高预测精度的基于ensemble技术(多分类器投票表决)

3、的亚定位预测方法。4.蛋白质磷酸化作为⋯种最常见的蛋白翻译后修饰(PTM)过程,在⋯系列生物细胞活动中起着重要的作用。目前对蛋白质激酶底物的实验测定方法通常非常费时,而且.会受多种实验条件的限制。通过机器学习的方法,利用蛋白质的序列信息列不同激酶家族作用的磷酸化位点进行预测,不仅具有快速、自动等优点,还可以对相应的实验测定进行指导。本文提出了一种基于Euc]idea,ri距离的改进☆近邻算法,特征向量由基于BLOSUM62矩阵的平均分值构成。对多个磷酸激酶家族的测试结果显示,预测结果好于目前常用的Scansite.

4、KinasePhos和NetPhosK方法,还具有简单、高效、鲁棒性好等优点。本文的研究二[作得到了中国科学技术大学高水平大学建设重点项目以及国家科技部重点科研项目(2004AA2351lO)的资助。基于统计建模方法的蛋白质结构预测研究摘监ABSTRACTFromI980’S,bioinformaticsbegantoappearanddevelopedwithveryhighspeedItmainlydealswithbiologicaldatabymeansofstoring.searchingandperfo

5、rminganalysiswiththepowerofmoderncomputers.Bioinformaticsisthecuttingedgeol’lifeandnaturalsciencesnowadaysandwillbeoneofthemostimportantresearchareasinthe21“century.Theadvanceofbioinformaticswillbeanevolutionarypowertocurrentlifesciences:notonlybasicresearchfi

6、elds,butalsoagriculture,medicineandpublichealth,foodindustry.andSOon.willbenefitfromitsmerits.OneurgentworkforcurrentbioinfonnaticsresearchellSistoinvestigateefficientmethodologiesbasedonstatisticalmodeling:andtopredictoranalysesthemountainousdatadepositedincu

7、rrentpublicdatabases.Comparingtotraditionalbench-experiments:advantagesoftheseapproachesfromstatisticalmodeling(HiddenMarkovModel,SupportVectorMachine.k-NearestNeighbor,etc)areapparent:fast.automaticandefficientintimeandlaborresources,especiallyinhighthroughpu

8、tlarge*scalesequenceanalysis.Inthispaperwemainlycarrythroughdeeplyresearchonthesepredictionmethodsbasedonstatisticmodelingonthebackgroundofthepredictionofproteins’structureandfunct

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。