多序列比对的原理以及clustal在多序列比对中的应

多序列比对的原理以及clustal在多序列比对中的应

ID:27667804

大小:916.51 KB

页数:29页

时间:2018-12-02

多序列比对的原理以及clustal在多序列比对中的应_第1页
多序列比对的原理以及clustal在多序列比对中的应_第2页
多序列比对的原理以及clustal在多序列比对中的应_第3页
多序列比对的原理以及clustal在多序列比对中的应_第4页
多序列比对的原理以及clustal在多序列比对中的应_第5页
资源描述:

《多序列比对的原理以及clustal在多序列比对中的应》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、多序列比对的原理以及clustal在多序列比对中的应用中山大学生科院2003年10月内容提要多序列比对的意义多序列比对的方法自动多序列比对的算法Clustalx的使用(clustal法)实例分析序列相似性比较和序列同源性分析序列相似性比较:就是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与此序列相似的已知序列是什么。完成这一工作只需要使用两两序列比较算法。常用的程序包有BLAST、FASTA等;序列同源性分析:是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。这是理论

2、分析方法中最关键的一步。完成这一工作必须使用多序列比较算法。常用的程序包有CLUSTAL等;多序列比对的意义用于描述一组序列之间的相似性关系,以便了解一个基因家族的基本特征,寻找motif,保守区域等。用于描述一个同源基因之间的亲缘关系的远近,应用到分子进化分析中。其他应用,如构建profile,打分矩阵等。同源性分析中常常要通过多序列比对来找出序列之间的相互关系,和blast的局部匹配搜索不同,多序列比对大多都是采用全局比对的算法。这样对于采用计算机程序的自动多序列比对是一个非常复杂且耗时的过程,特别是序列数目多,且序列长的情况下。多序列比对的方法多序列比对的方法

3、基本上多序列比对可以分为1.手工比对(辅助编辑软件如bioedit,seaview,Genedoc等)通过辅助软件的不同颜色显示不同残基,靠分析者的观察来改变比对的状态。2.计算机程序自动比对通过特定的算法(如同步法,渐进法等),由计算机程序自动搜索最佳的多序列比对状态。自动多序列比对的算法1.同步法将序列两两比对时的二维动态规划矩阵扩展到三维矩阵。即用矩阵的维数来反映比对的序列数目。这种方法的计算量很大,对于计算机系统的资源要求比较高,一般只有在进行少数的较短的序列的比对的时候才会用到这个方法。自动多序列比对的算法2.步进法最常见的就是clustal所采用的方法。

4、其基本思想就是基于相似序列通常具有进化相关性的这一假设。Clustal的渐进比对过程在比对过程中,先对所有的序列进行两两比对并计算它们相似性分值,然后根据相似性分值将它们分成若干组,并在每组之间进行比对,计算相似性分值。根据相似性分值继续分组比对,直到得到最终比对结果。在比对过程中,相似性程度较高的序列先进行比对而距离较远的序列添加在后面。多序列比对工具 -clustalXClustal是一个单机版的基于渐进比对的多序列比对工具,由HigginsD.G.等开发。有应用于多种操作系统平台的版本,包括linux版,DOS版的clustlw,windows版本的clust

5、alx等。Clustal简介CLUSTAL是一种渐进的比对方法,先将多个序列两两比对构建距离矩阵,反应序列之间两两关系;然后根据距离矩阵计算产生系统进化指导树,对关系密切的序列进行加权;然后从最紧密的两条序列开始,逐步引入临近的序列并不断重新构建比对,直到所有序列都被加入为止。Clustalx的工作界面 (多序列比对模式)Clustalx的工作界面 (剖面(profile)比对模式)Clustal的工作原理Clustal输入多个序列快速的序列两两比对,计算序列间的距离,获得一个距离矩阵。邻接法(NJ)构建一个树(引导树)根据引导树,渐进比对多个序列。Clustal的

6、应用1.输入输出格式。输入序列的格式比较灵活,可以是前面介绍过的FASTA格式,还可以是PIR、SWISS-PROT、GDE、Clustal、GCG/MSF、RSF等格式。输出格式也可以选择,有ALN、GCG、PHYLIP和NEXUS等,用户可以根据自己的需要选择合适的输出格式。2.两种工作模式。a.多序列比对模式。b.剖面(profile)比对模式。3.一个实际的例子。Clustal的应用多序列比对实例输入文件的格式(fasta):>KCC2_YEASTNYIFGRTLGAGSFGVVRQARKLSTN……>DMK_HUMANDFEILKVIGRGAFSEVAVV

7、KMKQTGQVYAMKIMNK…….>KPRO_MAIZETRKFKVELGRGESGTVYKGVLEDDRHVAVKKLEN……>DAF1_CAEELQIRLTGRVGSGRFGNVSRGDYRGEAVAVKVFNALD……>1CSNHYKVGRRIGEGSFGVIFEGTNLLNN……第一步:输入序列文件。第二步:设定比对的一些参数。参数设定窗口。第三步:开始序列比对。第四步:比对完成,选择保存结果文件的格式在线的clustalw分析1.EBI提供的在线clustalw服务http://www.ebi.ac.uk/clustalw/2.我们构建的在线clu

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。