dna序列比较与比对

dna序列比较与比对

ID:4121680

大小:588.80 KB

页数:36页

时间:2017-11-29

dna序列比较与比对_第1页
dna序列比较与比对_第2页
dna序列比较与比对_第3页
dna序列比较与比对_第4页
dna序列比较与比对_第5页
资源描述:

《dna序列比较与比对》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、7.91/7.36/BE.490第二讲2004-02-26DNA序列比较与比对ChrisBurge第一讲回顾:“基因组测序和DNA序列分析”•基因组学术语-cDNAs,ESTs,BACs,Alus,等等.•双脱氧法和鸟枪法测序-“鸟枪法覆盖方程式”(泊松)•BLAST项目-BLAST[PNX],TBLAST[NX]•高得分片断的统计学BAC和基因组的鸟枪法测序200KB(NIH)超声波降解,亚克隆3GB(celera)亚克隆序列,组合组合中那些因素将导致问题鸟枪法邻接片段DNA序列比对IV哪一个对齐是有效的?用动态规划算法确定得分S超过阈值X的高得分序列得分遵循以下极限分布对于长度为m和n

2、的序列,K和λ依赖于记分矩阵,由比对的序列确定(蛋白对齐有相同的理论)来自M.YaffeNOTEs(cont)第二讲极值分布(A)和正态分布(B)概率值.曲线下面积为1.•随意的序列比对得分会导致分布极值的增大——如偏高斯分布•称为Gumbel极值分布对于均值为m方差为σ的正态分布,曲线高度可以用Y=1/(σ√2π)exp[-(x-m)2/2σ2]来描述对于极值分布,曲线高度可以用Y=exp[-x-e-x]…andP(S>x)=1-exp[-e-λ(x-u)]来描述,u=(lnKmn)/λ可以显示平均极值得分为~log(nm),获得得分超过某2一标准偏差X的可能性为P(S>x)~Kmne-

3、λx。****K和λ已制为差别矩阵表减少统计偏移:E~Kmne-λSDNA序列的比较和比对•目标频率和错配罚分•真核基因结构•比较基因组学应用:-PipMaker(双序列比对)-系统发育投影(多序列)•DNA序列基序的介绍参考Mount的第七章DNA序列比对Vλ和得分矩阵有什么关系Λ是以下等式的唯一解:其中P=核苷酸i的频率;S=i,j对对齐的得分iij该等式是什么类型?(先验)如果记分为原来的两倍,λ将发生怎样的变化?(减少为原来的一半)通过这些,我们可以发现λ的本质是什么?(缩放因子)*Karlin&Altschul,1990DNA序列比对VIDNA使用怎样的记分矩阵?通常使用简单匹配

4、-错配矩阵:iACGTjA:1mmmSi,j:Cm1mmGmm1mTmmm1m=“错配罚分”(必为负数)DNA序列比对VII怎样选择错配罚分?使用高比值片段结构理论*高分值片段有如下构成:q=ppeλsijijij其中q=i,j配对的频率(“目标频率”)ijp,p=序列中i,j碱基被比较的频率ij如果我们把所有记分加倍,目标频率发生怎样的改变*Karlin&Altschul,1990DNA序列比对VIII仍然是如何选择错配罚分m目标频率:q=ppeλsij⇒⇒si,j=In(q/pp)/λijijijij如果你想找到有R%一致性的区域:r=R/100q=r/4q=(1-r)/12(i,j)

5、设s=1iiijii那么m=s=s/s=ln(q/pp)/λ)/(ln(q/pp)/λ(i≠j)ijijiiijijiiii⇒m=ln(4(1-r)/3)/ln(4r)DNA序列比对IX最重要的一件事是理解错配罚分:m=ln(4(1-r)/3)/ln(4r)例如:r0.750.950.99m-1-2-3r=BLAST采样的匹配程度期望分数核酸-核酸BLAST网络服务器其他改进DNA序列比对XNCBIBLAST高级选项:-G插入或删除成本分值[整数]默认值=核酸5,蛋白质11-E缺口成本分值[整数]默认值=核酸2,蛋白质1-q核苷酸错配罚分[整数]默认值=-3-r核苷酸匹配奖励[整数]默认值

6、=1-e期望值[实数]默认值=10真核基因表达*DNA转录(N)mRNA前体剪接(N)mRNAAAAAAAA蛋白质人类基因结构(PSA)典型人类基因统计数据初级转录物长度:~30,000bp外显子数目:~8-10平均(内部)外显子长度:~150bp平均内含子长度:~3,000bp比较基因组学-例子•PipMaker:应用于-人/鼠外显子搜索-人/鼠调节区搜索•系统发育投影:应用于-多基因组外显子搜索-多基因组调节区搜索PipMaker-双基因组序列符合度百分图(PercentIdentityPlot,PIP)PIP图解请参考下文图一:Schwartz,Scott,ZhengZhang,Ke

7、llyA.Frazer,ArianSmit,CathyRiemer,JohnBouck,RichardGibbs,RossHardison,andWebbMiller."PipMaker--AWebServerforAligningTwoGenomicDNASequences."GenomeRes.10(April2000):577-586.PipMaker的应用#1-人/鼠外显子的搜索请参考下文图二:Schwartz,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。