生物信息学-功能预测与注释

生物信息学-功能预测与注释

ID:37231500

大小:1.89 MB

页数:77页

时间:2019-05-20

生物信息学-功能预测与注释_第1页
生物信息学-功能预测与注释_第2页
生物信息学-功能预测与注释_第3页
生物信息学-功能预测与注释_第4页
生物信息学-功能预测与注释_第5页
资源描述:

《生物信息学-功能预测与注释》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、生物信息学功能预测与注释吴凌云中国科学院数学与系统科学研究院http://zhangroup.aporc.org基因组注释•Genomeannotation•利用生物信息学方法,对基因组各组成部分进行识别,并对其生物学功能进行注释•主要内容–基因识别与功能注释–非编码基因的识别与功能注释–调控元件的识别与功能注释–影响染色体结构和动力学的序列基因的识别与功能注释•基因预测•序列搜索•序列motif•直系同源序列聚类分析(COG)•亚细胞定位•结构比较•蛋白质组学序列搜索•假设:序列相似=同源=功能相似•数据库–NCBI-NT(非冗余核酸序列数据库)–NCBI-NR(非

2、冗余蛋白质序列数据库)–InterPro(Swissprot)(蛋白质序列数据库)–KEGG–PDBseq(已知三维结构的蛋白质序列数据库)序列motif•查找序列上的局部特征•在序列同源性不明显的情况下使用•Motif数据库构建–对蛋白质家族成员进行多序列比对•数据库–Prosite同源•直系同源(Ortholog)–不同物种中由同一祖先进化而来的多个基因–功能较一致•旁系同源(Paralog)–同一基因组内由于基因复制而来的多个基因–功能差异较大直系同源与旁系同源直系同源序列聚类分析•假设:直系同源=功能相似•数据库–COGs(ClustersofOrtholog

3、ousGroupsofproteins)–EachCOGconsistsofindividualproteinsorgroupsofparalogsfromatleast3lineagesandthuscorrespondstoanancientconserveddomain.亚细胞定位•假设:蛋白质的亚细胞定位与功能相关•通过预测亚细胞定位来预测功能结构比较•假设:结构决定功能•预测未知基因的蛋白质结构,再通过结构比较预测其功能蛋白质组学•假设:功能相关的蛋白质可能倾向于有相互作用•从蛋白质相互作用网络或者其他生物分子网络来预测蛋白功能Function•Thewor

4、dfunctionwithinabiologicalcontextisanevolvingconceptandisusedinmanyways.•Functioncanbedescribedatmanylevels,rangingfrombiochemicalfunctiontobiologicalprocesses,allthewayuptotheorganismlevel.•Ifonlysayaproteinhassomefunction,thathasfewmeaningtobiologist.ClassificationofFunction•EC–Enzyme

5、Commissionscheme•FunCat–MIPSFunctionalCatalogue•GO–GeneOntologyEC•EnzymeCommissionnumber–Basedonthechemicalreactionstheycatalyze.–EveryECnumberisassociatedwitharecommendednamefortherespectiveenzyme.–Strictlyspeaking,ECnumbersdonotspecifyenzymes,butenzyme-catalyzedreactions.–Ifdifferente

6、nzymes(forinstancefromdifferentorganisms)catalyzethesamereaction,thentheyreceivethesameECnumber.KEGGPatywayMIPSFunCatGeneOntology(GO)•Unifytherepresentationofgeneandgeneproductattributesacrossallspecies–Maintainandfurtherdevelopitscontrolledvocabularyofgeneandgeneproductattributes–Annot

7、ategenesandgeneproducts,andassimilateanddisseminateannotationdata–ProvidetoolstofacilitateaccesstoallaspectsofthedataprovidedbytheGeneOntologyprojectGODomains•ThreeseparateGOdomains–Molecularfunctions–Biologicalprocesses–Cellularcomponents•Eachgeneorgeneproductmay–havemorethano

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。