生物信息学 序列分析课件.ppt

生物信息学 序列分析课件.ppt

ID:57019862

大小:424.00 KB

页数:36页

时间:2020-07-26

生物信息学 序列分析课件.ppt_第1页
生物信息学 序列分析课件.ppt_第2页
生物信息学 序列分析课件.ppt_第3页
生物信息学 序列分析课件.ppt_第4页
生物信息学 序列分析课件.ppt_第5页
资源描述:

《生物信息学 序列分析课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、生物信息学Bioinformatics1文献检索限制字段类别常用的有:Author:BaoYM[au]Title:stress[ti]Tilte/Abstract:stress[title/abstract]Date:1999:2009[dp]2布尔逻辑运算:AND、OR、NOT必须大写。逻辑符的运算次序是从左至右,括号内的检索式可作为一个单元,优先运行。布尔逻辑检索允许在检索词后面附加字段标识例如:rice[ti]ANDBaoYM[au]AND2008:2009[dp]文献检索3同样存在限制字段:常用的有:Author:BaoYM[au]title:

2、SNARE[ti]organism:rice[organism]或者直接输入:Accession:AY077725[Accession]GeneName:ZFP15[GeneName]ProteinName:ZFP15[ProteinName]如:BaoYM[au]ANDSNARE[ti]ANDrice[organism]如果没有限定,就是任意字段。如何获取GenBank中的序列?4编号名称第一章生物信息学引论第二章生物信息学的生物学基础第三章生物信息学数据库资源第四章DNA和蛋白质序列分析第五章系统发生分析第六章基因表达数据分析第七章其他常用生物信息

3、学工具第八章电子克隆的原理和应用第九章基本生物信息学工具的开发与应用5第四章DNA与蛋白质序列分析6什么是序列分析?拿到一个基因/蛋白质序列,我能做什么?7在数据库中进行序列相似性搜索基因结构分析/启动子序列分析Motif的寻找与序列的模式识别(含亚细胞定位,跨膜区的预测等)序列分析的内容-----为了功能的分析8序列比对第1节9序列的相似性相似性(similarity)是指一种很直接的数量关系。比如说,A序列和B序列的相似性是80%,或者4/5。这是个量化的关系。10序列的相似性相似性(similarity)通常在某些位点上有一些氨基酸被另外一些化学

4、物理特性相近的氨基酸所代替,这种突变可称为保守突变。将保守突变的因素考虑在内,就可以对两序列的相似程度打分,所得分值即代表其相似的程度。11一致性(identity):两个蛋白质有一定数量的氨基酸在排比的位点上是相同的,即如果38个氨基酸的蛋白质中15个位点相同,我们说它们一致性为39.4%.MSDTPSTGFSIIHPTSSEGQVPPPRHLSLTHPVVAKRISFYKSG-------------PRNGTIKIYENPARTFTRPYSAKNITIYKEND12所以,相似性的数值一定比一致性的要()大or相等or小13同源性(homology

5、):指从一些数据中推断出的两个基因或蛋白质序列具有共同祖先的结论,属于质的判断。就是说A和B的关系上,只有是同源序列,或者非同源序列两种关系。而说A和B的同源性为80%都是不科学的。生物序列的同源性14相似性和同源性关系一般来说,序列间的相似性越高的话,它们是同源序列的可能性就更高。注意不要等价混用这两个名词。A序列和B序列的同源性为80%,记住这种说法是错误的!!15序列比较的基本操作是比对(Alignment)两个序列的比对是指这两个序列中各个字符的一种一一对应关系,或字符的对比排列。设有两个序列:GACGGATTAG,GATCGGAATAGAli

6、gnment2:GACGGATTAGGATCGGAATAGAlignment1:GACGGATTAGGATCGGAATAG16编辑距离(EditDistance)GCATGACGAATCAGTATGACAAACAGCGCATGACGAATCAGTATGAC-AAACAGC说明两条序列的相似程度——〉定量计算序列比对的基本原理17字符编辑操作(EditOperation)字符编辑操作可将一个序列转化为一个新序列Match(a,a)Delete(a,-)Replace(a,b)Insert(-,b)序列比对的基本原理18相

7、似度,它是两个序列的函数,相似度越大,表示两个序列越相似距离,距离越大,则两个序列的相似度就越小序列比对的基本原理19通过点矩阵进行序列比较“矩阵作图法”或“对角线作图”进行序列比较的方法1202122→序列1→→序列2→实例23→序列1→→序列1→自我比较24滑动窗口技术两条序列中有很多匹配的字符对,因而在点矩阵中会形成很多点标记。25滑动窗口技术使用滑动窗口代替一次一个位点的比较是解决这个问题的有效方法。假设窗口大小为10,相似度阈值为8,则每次比较取10个连续的字符,如相同的字符超过8个,则标记基于滑动窗口的点矩阵方法可以明显地降低点阵图的噪声,

8、并且明确无误的指示出了两条序列间具有显著相似性的区域。26(a)对人类(Homosapiens

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。