欢迎来到天天文库
浏览记录
ID:25225696
大小:2.01 MB
页数:63页
时间:2018-11-18
《生物信息学之数据库及在线分析工具》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、生物信息学数据库及在线分析工具SeeQ@ZIFF一、数据库(Database)用于收集、整理、储存、加工、发布和检索数据的系统。生物类的数据库种类很多(序列、结构、生物分子互作、其他)投稿文章首先要将核苷酸序列或蛋白质序列提交到相应的数据库中数据库记录通常包括两部分原始数据对这些数据进行的生物学意义的注释一个数据库通常链接了多个相关数据库核苷酸数据库-水稻抗病相关基因OsDR8DQ176424Taxonomy数据库Pubmed数据库NCBI-Protein数据库(一)数据库工具建立纯文本数据库GenBan
2、k数据库、EMBL核苷酸数据库数据库工具SQL(结构化查询语言)是世界上流行的和标准化的数据库语言能够快速灵活存储记录文件和图像下载网址http://download.mysql.cn/AccessSQLOracleAceDB数据库工具AceDB:AC.elegansDataBase(线虫数据库)被广泛应用的管理和提供基因组数据的工具数据形式丰富遗传图谱G1810.420.84RM2240.21R15060.21Xa26S128861.470.000.63L1044NBS119RM144Y6855RA0.
3、0011新陈代谢途径物理图谱1gggctccaccactagtacccctcactacaggtagccataaaaaaaatcgatcaccaaaac61ccattattaggttgtgtactgatacagaaagttgggaaccaatctcccagcacagaaaac121ggtacggttcattagcgcgtgattaattaaatatttactattttttaaaaaaaatagatc181aatatgatttttaagcaactttcgtataaatactttttcaaaaaaacacacc
4、gttttcta241gtttgaaaagcgtacacgcgtgaaatgagggagaaaggttggaaacgtgggattgcaaac(二)各种生物数据库1、核苷酸数据库DNA、mRNA、tRNA、rRNA序列RNA序列以cDNA序列的形式收集核苷酸序列直接来源于实验数据大量氨基酸序列主要是非实验来源数据codingsequence(CDS)EXONINTRONCDS(codingsequence)ORF(openreadingframe)数据库种类很多三大核苷酸数据库GenBank、EMBL核苷
5、酸数据库、DDBJUnitedStatesPatentandTrademarkOffice(USPTO)EuropeanPatentOffice(EPO)JapanPatentOffice(JPO)收集了专利的核苷酸序列信息资源共享:以天为基础进行数据库之间的序列数据交换(1)GenBankhttp://www.ncbi.nlm.nih.gov/美国NCBI的数据库,有部分蛋白质序列数据每天更新,每年发行六版releaseftp://ftp.ncbi.nih.gov/genbank/gbrel.txtRe
6、lease172(2009.6.15)106,073,709entries105,277,306,080bases来源于260,000多个物种大约12%的序列来源于人(Homosapiens)……GrowthofGenBankLocusname(位点名)Accessionnumber(注册号或登陆号)GI(GenInfoidentifier)NID(NucleotideID)每个序列有一个flatfile每条序列有三个专有的编号或标识(identifier)LOCUSlineSamplerecordhtt
7、p://www.ncbi.nlm.nih.gov/Sitemap/samplerecord.htmlThedivisionsofGenBank分支缩写分支全称PRI灵长类序列(primatesequences)ROD啮齿类序列(rodentsequences)MAM其它哺乳类序列(othermammaliansequences)VRT其它脊椎动物序列(othervertebratesequences)INV无脊椎动物序列(invertebratesequences)PLN植物、真菌和海藻类序列(plant
8、,fungal,andalgalsequences)BCT细菌序列(bacterialsequences)VRL病毒序列(viralsequences)PHG噬菌体序列(bacteriophagesequences)SYN合成序列(syntheticsequences)ThedivisionsofGenBank分支缩写分支全称UNA未注释的序列(unannotatedsequences)EST表达序列标签(expresseds
此文档下载收益归作者所有