dna序列比对终极版符程序2

dna序列比对终极版符程序2

ID:8806684

大小:248.50 KB

页数:9页

时间:2018-04-08

dna序列比对终极版符程序2_第1页
dna序列比对终极版符程序2_第2页
dna序列比对终极版符程序2_第3页
dna序列比对终极版符程序2_第4页
dna序列比对终极版符程序2_第5页
资源描述:

《dna序列比对终极版符程序2》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、DNA序列的分类和比对摘要问题一:利用MATLAB对24个DNA序列进行两两对比,将第i个与i后面的所有序列进行比较(i=1,2......24),筛选出相似度85%的比对序列分为同一类。问题二:为了从题目中的24个碱基对的DNA序列中找出含有52个碱基对的新序列CTACCGCCTCGGAAACGGCGTGTGTGGAATTGTGGCATTAAATTCTTTCACT的进化来源,本文用了递推序列比对法,利用MATLAB软件,将新序列与24个DNA序列化为矩阵形式,将新序列从左到右以单位1的间隔移动,每移动一次,就将重叠部分的碱基比对一次。最后找出相似度最高的DNA序列。关键词:序列比对MATLA

2、B子序列矩阵相似度一、问题重述下面的24个DNA序列(附录一)是来自不同物种的一个基因片段,请将它们分类。另外,如果有一个新的序列“CTACCGCCTCGGAAACGGCGTGTGTGGAATTGTGGCATTAAATTCTTTCACT”请判断它最可能是哪个序列的一部分进化来的。二、问题分析问题一:利用MATLAB对24个DNA序列进行两两对比,将第i个与i后面的所有序列进行比较(i=1,2......24),筛选出相似度较高的序列分为同一物质。利用MATLAB设计程序,将24个DNA序列两两比较:先用与进行比较,再用与比较,以此类推,直到比对完。问题二:将所有序列用一维矩阵形式表示,由于新序

3、列只有52个碱基对,故对DNA序列进行分割后,相减得到一维矩阵。一维矩阵里的元素中,0代表重叠部分。其他不为0的元素均代表不重叠部分。根据元素0的分布,很容易可以看出相同碱基对的连续性。选择标准:若两个0相邻则附值1,间隔1赋值0.5^1,间隔2赋值0.5^2,以此类推。直到间隔数大于5时,则将它剔除。以此标准将各个赋值相加。最后比较相似度(S=L/52*100%)大小得出结论。三、问题假设假设一:所有碱基对都准确无误;假设二:不考虑碱基序列的非编码区和编码区的区别;假设三:将DNA序列中除A、T、G、C外的碱基进行转化,对结果没有影响四、符号说明M新序列矩阵第i个DNA序列J重叠部分相减得到

4、的矩阵S相似度L连续性程度五、模型的建立与求解5.1模型一5.1.1模型的建立1、利用MATLAB设计程序,将24个DNA序列两两比对:先用与进行比对,再用与比对,以此类推,直到比对完。2、比对方法举例子:新序列CAT;已知序列ATTGCATCCGT比对:ATGCTAT1CTA2CTA3CTA4CTA5CTA3、相同碱基判断方法:按以上方法一一比对,将重叠部分相减得矩阵J。提取出含0元素最多的矩阵,再用这个矩阵中0元素的个数除以两个比对序列中较短的碱基个数,从而的到相似度。2、计算出各个比对的相似度,提取出相似度大于等于85%的比对,定义为同类DNA序列。5.1.2模型一的求解1、利用MATL

5、AB(程序一)得到,各个比对的相似度为:1234567891011121120.4236130.26090.4481140.43860.330.5043150.42130.60370.38580.6143160.42320.32130.55950.46770.4749170.43020.27520.57690.67860.45440.3113180.27560.27950.50570.41710.30540.48780.453190.42050.29480.31210.32660.44360.30350.31070.31361100.41360.32050.49630.51990.46680.

6、47120.47860.47560.38851110.38060.66140.28350.43860.33760.60550.29910.28550.45230.49481120.31320.66140.28350.28430.28940.28120.29910.28550.45230.494811130.28790.29680.28210.28140.27940.2740.28350.28130.44940.31610.61440.6144140.3610.60090.28350.36140.34330.60690.28350.28550.44360.46380.61230.3796150.

7、3610.57490.34270.680.34330.58540.32050.3040.4480.51110.5710.5736160.45440.2780.47680.36920.49930.4260.59940.51420.31690.30190.52170.2975170.39790.2790.35680.36420.33920.37590.39210.40680.29220.3250.47

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。