生物竞赛-生物信息学部分-核酸序列比较课件.ppt

生物竞赛-生物信息学部分-核酸序列比较课件.ppt

ID:57373335

大小:2.36 MB

页数:43页

时间:2020-08-13

生物竞赛-生物信息学部分-核酸序列比较课件.ppt_第1页
生物竞赛-生物信息学部分-核酸序列比较课件.ppt_第2页
生物竞赛-生物信息学部分-核酸序列比较课件.ppt_第3页
生物竞赛-生物信息学部分-核酸序列比较课件.ppt_第4页
生物竞赛-生物信息学部分-核酸序列比较课件.ppt_第5页
资源描述:

《生物竞赛-生物信息学部分-核酸序列比较课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、序列比较第一部分11认识序列序列(sequence)就是个字符串(string)。s=abcdefghijklmnopqrstuvwxyzsi代表序列s的第i个字符,比如s4=ds’=abcde,序列s’是序列s的子序列(substring)2>nameCTCCTGACCTCAGGCGATTCGCCCGCCTCGGCCTCCCAAAGTGCTAGGATTACAGGCGTGAGCCACCACGCCCGGCCACACTAACTTTTTAAGAGCCAAGAGTTCGATCGGTAGCGGGAGCGGAGAGCGGACCCCAGAGAGC

2、CCTGAGCAGCCCCACCACCACCGCTGGCCTAGCTACCATCACACCCCGGGAGGAGCCGCAGCTGCCGCAGCCGGCCCCAGTCACCATCACCACAACCTTGAGCAGCGAGGCCGAGACCCAGCAGCCGCCCGCCGCTTGCCGCTCGCCGCCCCCCGCCCTCAGCGCCGGTGACACCACGCCCGGCACTACGGGCAGCGGCACAGGAAACGGTGGCCCGGGAGGCTTCACATCAGCAGCACCTGCCGGCGGGGACAAGAAGGTCATCGCAA

3、CGAAGGT核酸序列:由4个不同的字母(碱基)排列组合而成。(DNA序列,RNA序列)FASTA格式:第一行:大于号加名称或其它注释第二行以后:每行60个字母(也有80的,不一定)1认识序列:核酸序列3>nameMHHHHHHSSGRENLYFQGKLPEPQFYAEPHTYEEPGRAGRSFTREIEASRIHIEKIIGSGDSGEVCYGRLRVPGQRDVPVAIKALKAGYTERQRRDFLSEASIMGQFDHPNIIRLEGVVTRGRLAMIVTEYMENGSLDTFLRTHDGQFTIMQLVGMLRGVGA

4、GMRYLSDLGYVHRDLAARNVLVDSNLVCKVSDFGLSRVLEDDPDAAXTTTGGKIPIRWTAPEAIAFRTFSSASDVWSFGVVMWEVLAYGERPYWNMTNRDVISSVEEGYRLPAPMGCPHALHQLMLDCWHKDRAQRPRFSQIVSVLDALIRSPESLRATATVS蛋白质序列:由20个不同的字母(氨基酸)排列组合而成。FASTA格式:第一行:大于号加名称或其它注释第二行以后:每行60个字母(也有80的,不一定)1认识序列:蛋白质序列4在麻将连连看中,你需要用眼睛从一推麻将牌

5、中找出一对相同的麻将牌。2序列相似性数据库中的序列相似性搜索5对于一个蛋白质或核酸序列,你需要从序列数据库中找到与它相同或相似的序列。不可能再用眼睛去比较每一对序列,因为数据库中有太多序列,甚至用眼睛比较一对序列都是不可能做到的。……BLAST2序列相似性数据库中的序列相似性搜索6序列相似性的重要性相似的序列往往起源于一个共同的祖先序列。它们很可能有相似的空间结构和生物学功能,因此对于一个已知序列但未知结构和功能的蛋白质,如果与它序列相似的某些蛋白质的结构和功能已知,则可以推测这个未知结构和功能的蛋白质的结构和功能。相似的序列相似的

6、结构相似的功能2序列相似性7结构相似?功能相似?序列相似性的重要性相似的序列往往起源于一个共同的祖先序列。它们很可能有相似的空间结构和生物学功能,因此对于一个已知序列但未知结构和功能的蛋白质,如果与它序列相似的某些蛋白质的结构和功能已知,则可以推测这个未知结构和功能的蛋白质的结构和功能。2序列相似性8结构相似?功能相似?序列相似性的重要性相似的序列往往起源于一个共同的祖先序列。它们很可能有相似的空间结构和生物学功能,因此对于一个已知序列但未知结构和功能的蛋白质,如果与它序列相似的某些蛋白质的结构和功能已知,则可以推测这个未知结构和功

7、能的蛋白质的结构和功能。2序列相似性9一致度:如果两个序列(蛋白质或核酸)长度相同,那么它们的一致度定义为他们对应位置上相同的残基(一个字母,氨基酸或碱基)的数目占总长度的百分数。相似度:如果两个序列(蛋白质或核酸)长度相同,那么它们的相似度定义为他们对应位置上相似的残基与相同的残基的数目和占总长度的百分数。问题:哪个残基与哪个残基算作相似答:残基两两相似的量化关系被替换记分矩阵所定义。序列一致度(identity)与相似度(similarity)2序列相似性101.等价矩阵(unitarymatrix):最简单的替换记分矩阵,其中

8、,相同核苷酸之间的匹配得分为1,不同核苷酸间的替换得分为0。由于不含有碱基的理化信息和不区别对待不同的替换,在实际的序列比较中较少使用。2.转换-颠换矩阵(transition-transversionmatrix):核酸的碱基按照环

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。