蛋白质序列分析

蛋白质序列分析

ID:38298682

大小:1.01 MB

页数:30页

时间:2019-06-08

蛋白质序列分析_第1页
蛋白质序列分析_第2页
蛋白质序列分析_第3页
蛋白质序列分析_第4页
蛋白质序列分析_第5页
资源描述:

《蛋白质序列分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、蛋白质序列分析王兴平3.1蛋白质数据库介绍3.2蛋白质序列分析3.3蛋白质序列分析及结构预测策略3.4一级结构的预测3.5二级结构预测方法3.6其他序列分析工具3.7三级结构预测3.8蛋白质家族分析内容3.1蛋白质数据库介绍蛋白质的结构主要分为四级,一级结构、二级结构、三级结构以及四级结构。依据这种结构层次,将蛋白质数据库分为:蛋白质序列数据库:如PIR、SWISS-PROT、NCBI,这些数据库的数据主要以蛋白质的序列为主,并赋予相应的注释;蛋白质模体及结构域数据库:如PROSITE、Pfam,这些

2、数据库主要收集了蛋白质的保守结构域和功能域的特征序列;蛋白质结构数据库:如PDB等,这些数据库主要以蛋白质的结构测量数据为主;蛋白质分类数据库:如SCOP、CATH、FSSP等,这其中又有以序列比较为基础的序列分类数据库以及以结构比较为基础的结构分类数据库之分。特征:这些数据库种类有差别,但内部是相互联系的,每个数据库都有指针指向其他数据库,而且数据库之间的序列以及相应的结构是共享的,同一种蛋白质依次会出现在不同的数据库,这样的数据沟通有助于更深层地挖掘蛋白质的内在生物信息,这些数据库是融序列信息的索

3、取、处理、存储、输出于一身的。3.1蛋白质数据库介绍功能:随着网络资源的日益丰富,蛋白质数据库不论其数据为何种形式,都具备3种功能:第一、对数据的注释功能。所有提交到数据库的数据都要由作者或数据库管理人员进行注释方能发布。第二、对数据的检索功能。数据经注释之后,访问者就可以通过数据库网页上提供的搜索引擎进行搜索,找到自己所需的蛋白质信息。第三、对数据的生物信息分析功能。访问者一旦找到感兴趣的蛋白质,就可以运用数据库提供的生物信息分析工具对蛋白质序列的未知数据进行预测,如预测蛋白质的理化性质,预测蛋白质

4、的二级结构,多重序列比对,等等,因此通过网上资源对蛋白质的生物信息做出比较完整的分析是可以做到的。3.1.1蛋白质序列数据库1.PIR(proteininformationresource,PIR)和PSD(proteinsequencedatabase,PSD)PIR的建立源于20世纪60年代MargaretO.Dayhoff从事的蛋白质进化关系的研究工作,起初的想法是通过对蛋白质序列信息资源全面、高质、合理的编制来协助计算生物学以及基因组学的研究。现在PIR由美国国家生物医学研究基金支助,隶属于G

5、eorgetown大学医学中心。由PIR、MIPS(MunichInformationCenterforProteinSequence,MIPS)以及JIPSD(JapanInternationalproteinSequenceDatabase,JIPSD)协作建立并维护的PIR国际蛋白质序列数据库(PSD),它是目前国际上最大的公共蛋白质序列数据库。3.1.1蛋白质序列数据库PIR-PSD是一个综合全面的、非冗余的、专业注释的、分类完整的蛋白质序列数据库。PIR-PSD的序列来自于将GenBank/

6、EMBL/DDBJ三大数据库的编码序列的翻译而成的蛋白质序列、发表的文献中的序列和用户直接提交的序列。以PIR-PSD为基础,PIR还衍生出PIRNREF、iPROClass以及其他PIR辅助数据库,为基因组学和蛋白质组学提供了从序列到结构直至功能的完整分析工具。网址:http://pir.georgetown.edu/pirwww课堂演示,网页及认识数据库内容。3.1.1蛋白质序列数据库2.SWISS-PROT/TrEMBL数据库(www.expasy.org/swissprot)SWISS-PRO

7、T数据库是经注释的蛋白质数据库,始建于1986年,现在由瑞士生物信息研究所(SwissInstituteofBioinformatics,SIB)和欧洲生物信息研究所(EuropeanBioinformaticsInstitute,EBI)共同维护。它是ExPASy网站的一部分,数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰位点、特殊位点和区域、二级结构、四级结构、与其他序列的相似性、序列残缺与疾病的关系、序列变异体等信息。3.

8、1.2模体以及结构域数据库1.模体数据库(1)PROSITE蛋白质家族及结构域数据库(www.expasy.org/prosite/)PROSITE数据库收集了有显著生物学意义的蛋白质位点序列、蛋白质特征序列谱库以及序列模型,并能依据这些特征属性快速可靠地鉴定出一个未知功能蛋白质序列属于哪个蛋白质家族,即使在蛋白质序列相似性很低的情况下,也可以通过搜索隐含的功能结构模体(motif)来鉴定,因此是有效的序列分析数据库。PROSITE中涉及的序列模式包括酶

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。