《核酸序列分析》课件

《核酸序列分析》课件

ID:38929387

大小:247.01 KB

页数:31页

时间:2019-06-21

《核酸序列分析》课件_第1页
《核酸序列分析》课件_第2页
《核酸序列分析》课件_第3页
《核酸序列分析》课件_第4页
《核酸序列分析》课件_第5页
资源描述:

《《核酸序列分析》课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四章核酸序列分析4.1DNA序列分析和基因结构DNA序列分析的目的意义在DNA序列中,除了基因之外,还包含许多其它信息,这些信息大部分与核酸的结构特征相关联,通常决定了DNA与蛋白质或者DNA与RNA的相互作用。存放这些信息的DNA片段称为功能位点,如启动子(Promoter)、基因终止序列(Terminatorsequence)、剪切位点(Splicesite)等。DNA序列分析就是在获得DNA原始序列的基础上,快速寻找基因,找出基因的位置及其功能位点,这对于基因的结构和功能研究,揭示生命奥秘具有重要意义。UTR,非翻

2、译区域(untranslatedregions)基因结构原核生物基因结构真核生物基因结构基因不连续性:基因的编码序列在DNA分子上是被不编码的序列隔开而不连续排列,绝大多数真核生物基因是不连续的,由内含子(intron)和外显子(exon)组成。发现重复元素数据库搜索分析功能位点综合分析基本的DNA序列分析方案遮蔽重复序列序列重复现象在原核、真核生物DNA中都存在,真核生物更普遍。有种属特异性,基因组越大重复序列含量越丰富。分为轻度重复序列、中度重复序列、高度重复序列等类型。一般来说,在进行任何DNA序列的基因分析之前,最

3、好把散布和简单的重复序列找出来并从序列中除去。虽然这些重复序列可能正好覆盖了由RNA聚合酶Ⅱ转录的部分区域,它们几乎不会覆盖启动子和外显子编码区。重复序列还常常会搅乱其它分析,特别是在数据库搜索中,由于重复序列的存在,可能得到许多同样的结果,这些结果的得分很高,使解释数据库搜索结果变得复杂、困难。相关资源CENSORhttp://www.girinst.org/censor/RepeatMaskerhttp://www.repeatmasker.org/cgi-bin/WEBRepeatMaskerRepbasehttp:

4、//www.girinst.org/index.html这些网站上的在线程序可帮助识别并去除重复序列。同源性检索一般来说,数据库相似性搜索是进行基因辨识的最初手段,也是DNA序列分析的最基本步骤。在同源性检索中,通过查询DNA数据库来判断查询序列是否与已知基因的序列相同或相似。例如,如果通过搜索发现待分析的序列与已知蛋白质编码序列相似,则可以推测待分析的序列是基因序列。基因分析序列翻译与开放阅读框(ORF)预测序列翻译指利用计算机程序将核酸序列按照三联体密码规则翻译成蛋白质序列,还可以将氨基酸序列倒翻成核酸序列。阅读框(r

5、eadingframes)对于任何给定的单链核酸序列,根据密码子的起始位置,可以按照三种方式进行解释,这三种阅读顺序称为阅读框。双链DNA序列有6个可读框开放阅读框(openreadingframes,ORF)以起始密码子(通常为ATG)开始,以终止密码子(TAA、TGA或TAG)结束(但不包括终止密码子),中间由一系列密码子组成的序列区域,它决定了所编码蛋白质的氨基酸顺序。DNA序列分析中基因识别的目的之一就是进行开放阅读框(ORF)的寻找和预测。ORF辨别的基本方法(1)利用编码区所具有的独特信号,比如起始密码子、终止

6、密码子等进行识别检查终止密码子的出现频率基本思想:如果能够找到一个比较长的序列,其相应的密码子序列不含终止密码子,则这段序列可能就是编码区域。基本算法:扫描给定的DNA序列,在三个不同的阅读框中寻找较长的ORF。遇到终止密码子以后,回头寻找起始密码子。这种算法过于简单,不适合于处理短的ORF或者交叠的ORF。分析各种密码子出现的频率基本思想:每种氨基酸是由相应个数密码子编码的,例如,亮氨酸、丙氨酸、色氨酸分别有6个、4个和1个密码子。将一个随机均匀分布的DNA序列翻译成氨基酸序列,理论上说各氨基酸在序列中出现的比例应该符合

7、氨基酸的密码子数目,如上述3种氨基酸出现的比例应该为6:4:1。但是在真实的氨基酸序列中,上述比例并不正确,这说明DNA的编码区域并非随机。基本算法:假设在一条DNA序列中已经找到所有的ORF,那么可以利用密码子频率进一步区分编码ORF和非编码ORF,利用这种方法,可以计算一个ORF成为编码区域的可能性。(2)利用编码区与非编码区的碱基组成不同进行识别由于蛋白质中20种氨基酸出现的概率不同,每种氨基酸的密码子兼并度不同,同一种氨基酸的兼并密码子使用频率不同等原因,造成单个碱基的组成比例和多个碱基的组成方式在不同的物种中呈现

8、出不同的规律。因此,可通过统计分析识别编码序列。(3)利用经验规律进行识别若在起始密码子上游发现了核糖体结合位点,则可肯定找到一个ORF。利用Kozak规则识别翻译起始位点Kozak规则是研究第一个ATG侧翼序列的碱基分布所满足的统计规律,若将第一个ATG中的碱基A,T,G分别标为1,2,3位,则Koz

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。