实习五:系统发育分析-PHYLIP,MEGA, MrBayes

实习五:系统发育分析-PHYLIP,MEGA, MrBayes

ID:40828336

大小:751.50 KB

页数:5页

时间:2019-08-08

实习五:系统发育分析-PHYLIP,MEGA, MrBayes_第1页
实习五:系统发育分析-PHYLIP,MEGA, MrBayes_第2页
实习五:系统发育分析-PHYLIP,MEGA, MrBayes_第3页
实习五:系统发育分析-PHYLIP,MEGA, MrBayes_第4页
实习五:系统发育分析-PHYLIP,MEGA, MrBayes_第5页
资源描述:

《实习五:系统发育分析-PHYLIP,MEGA, MrBayes》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、实习五:系统发育分析-PHYLIP,MEGA,MrBayes学号姓名专业年级实验时间提交报告时间实验目的:1.学会使用PHYLIP,MEGA和MrBayes构建进化树2.学会分析建树结果,体会各种方法差异实验内容:系统发育(phylogeny)也称系统发展,是与个体发育相对而言的,它是指某一个类群的形成和发展过程。系统发育学的目的是研究进化关系,系统发育分析就是要推断或者评估这些进化关系。通过系统发育分析所推断出来的进化关系一般用分枝图表(进化树)来描述,这个进化树就描述了同一谱系的进化关系,包括了分子进化(基因树)

2、、物种进化以及分子进化和物种进化的综合。多序列比对的目标是发现多条序列的共性。本次实验旨在使用PHYLIP,MEGA和MrBayes构建进化树,并通过分析构树的结果,了解各方法的差异性。作业:1.ListthetitleoftheorthologousnucleotideandproteinsequencesyoufoundfromPractice1.BuildphylogenetictreeswithPHYLIP,MEGAandMrBayesrespectively.Makeasimplecomparisonthe

3、treesyouhavegot,andtrytoexplainthedifference.核酸序列使用的是来自Trifoliumrepens(白车轴草)硬粒小麦(Triticumdurum)Camelliasinensis(山茶)Cicerarietinum(鹰嘴豆)及Glycinemax(大豆)dehydrin的编码脱水素(dehydrin)的DNA序列,这些物种将分别以TF,TC,Cam,Cic及Gly表示;首先对于PHYLIP中的关系,通过五种算法的构树结果可以发现其树形的差异不大。尤其是在FM,NJ,UPGM

4、A三种算法中,五个物种的亲缘关系显示出较强的一致性,这大概是由于这三种方法都是基于距离法(DistanceMethod)的基础上;其次若把FM法树形的从上到下的五个位置分别标号①-⑤(图),可以发现三种树形中只有UPGMA中的①和②位置有差别。实际上这种差别来自于UPGMA算法的特点:具有最近缘关系的两物种到父节点的距离相等,且等于这两物种距离的一半,其次在这个基础上再添加其他物种,而据枝长的等长不难看出,两物种一旦被确定为“近邻”,它们的位置颠倒与否都是等价的(即在例子中表现为Cam和Gly分别在①位和②位,与其分

5、别在②位和①位是等价的)。因此,从本质上讲由PHYLIP构建的FM,NJ,UPGMA三树无差异。同理,在MEGA软件据UPGMA与NJ构建的树形中(如图),树形也无太大差异,Cic最远,Tc与Tf近邻,Gly与Cam近邻,但比较的差别在于MEGA与PHYLIP软件UPGMA与NJ法得到的树形,这是由于其基于的距离数值的不同,也因为MEGA与PHYLIP对这五条序列采取的比对方法不同,PHYLIP使用的是Clustal法而MEGA用的比对结果来自于MUSCLE。其次,再看MP、ML(以Phylip为例)及Bayes法,

6、此次Baye法得到的结果与MP法较为接近,表现为Gly与Cam近邻,Tf与Cic近邻,Tc最远,不过MP法中涉及到了有效信息位点的选取的问题,我认为若个别序列长度很短的话很可能会影响整体五条序列比对的结果,这大概是MP法不大稳定的因素。最后,Bayes法与ML法树形有一定差异的原因大概是由于贝叶斯的方法很依赖于一个合适的进化模型,并建立在“独立性假设”的基础上:即,贝叶斯定理假设一个属性值对给定类的影响独立于其它属性的值,所以GTR模型是否适用还有待了解,至于ML法,在分析序列是也同样使用了一个概率模型来评估各种变异

7、。所以可以预见到,若Bayes法与ML法使用的概率模型不同,其比对结果自然就会有很大的差异。对于对应的五条蛋白质序列也有相似的特点,但值得注意的是,蛋白质序列没有考虑内含子的存在。倘若以蛋白质dehydrin本身为分析对象构树自然应使用蛋白质序列,但若构建物种树的话,使用核酸序列应更为准确。(下图为Phylip中蛋白序列的Bayes法构树结果)2.RunBLASTPwithaproteinsequencesyouareinterestedin,chooseRefSeqasthedatabase,selectmoret

8、han20hitsofdifferentidentity(atleastpickoneformaxidentityaround90%,80%......40%,pickadozenformaxidentity30-40%),downloadthesequencesandanalyzetheevolutionaryrelationshipamon

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。