基因结构与基因预测

基因结构与基因预测

ID:37194058

大小:1.83 MB

页数:104页

时间:2019-05-11

基因结构与基因预测_第1页
基因结构与基因预测_第2页
基因结构与基因预测_第3页
基因结构与基因预测_第4页
基因结构与基因预测_第5页
资源描述:

《基因结构与基因预测》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第六讲基因结构与基因预测§6.1高等真核生物基因结构与基因预测简介1基因(gene)的概念基因的概念随着科学的发展而不断发展,迄今为止,仍有各种说法。Todaywhenwespeakofageneforsomemalady,aregulatorygene,astructuralgene,oragenefrequency,itisentirelypossiblethatwearedeployingdifferentgeneconceptseventhoughweareusingthesameterm.——M.R.Dietrich

2、,2000从分子生物学的角度而言,一般认为基因是负载特定生物遗传信息的DNA分子片段,基因在一定条件下能够表达这种遗传信息,产生特定的生命功能。§6.1.1真核生物的基因结构2基因的分类按功能分为:(1)、结构基因(可被转录形成mRNA,并进而翻译成多肽链,构成各种结构蛋白质、催化各种生化反应的酶和激素等)(2)、调控基因(可调节控制结构基因表达的基因)(3)、只转录而不翻译的基因(如rRNA基因、tRNA基因)3人类基因的结构ORF(OpenReadingFrame):在DNA链上,由蛋白质合成的起始密码开始,到终止密码子为

3、止的一个连续编码序列。人类结构基因的结构包括4个区域:(1)、外显子;(2)、内含子;(3)、前导区(位于编码区上游,相当于mRNA5’端非编码区(非翻译区));(4)、调节区(包括启动子和增强子等基因编码区的两侧,也称为侧翼序列);人类结构基因的结构示意图人类结构基因的结构示意图Contig3ofCh21(Totallength:3,450,497Bp)Gene:“TRPC7”(Totallength:62,668Bp)Coding:3,345bp(1,115AA)25Exons:48~354bpIntergenicregi

4、onGeneExonIntron(1)、人类细胞核基因组中编码序列不到2%,约含3万左右不同的基因,且有近1/3为多拷贝;(2)、结构基因大多含有插入序列。即大部分基因为断裂基因(interruptedgene);(3)、外显子(exon)一般不长于800bp,内含子(intron)则在30bp~数十kb不等;(4)、mRNA剪接位点(Splicesites)的识别信号:每个外显子和内含子接头区都有一段高度保守序列(consensussequence),即内含子5’端大多数是GT(称为donorsite)开始,3’端大多数是A

5、G(称为acceptorsite)结束,称为GT-AG法则;人类基因组结构的特点(5)、尽管拥有相同的一套基因组,不同的分化细胞中所表达的基因也不同,每个细胞只表达一部分基因(例如:人脑细胞的基因表达百分比最高,为22%);(6)、转录在细胞核内进行,翻译在细胞质核糖体中进行,二者在时间空间上是分开的。4假基因假基因:与功能性基因密切相关的DNA系列,但由于缺失、插入和无义突变失去阅读框架而不能编码蛋白质产物。有些人类假基因可以转录但不能翻译成蛋白质。假基因的两种类型:(1)、由于一种基因的加倍而不能表达,但保留原来亲本基因的

6、外显子及内含子;(2)、仅含有亲本基因的外显子,源于mRNA并通过逆转录而重新整合进基因组的。5重复序列超过90%为重复序列,不编码mRNA前体或其它RNA。(个体间的重复序列有巨大差异-->DNA指纹)重复序列分为3类:高度重复序列、中等重复序列、低重复序列。目前的一些认识:(1)、GC含量低,AT含量高。(AT的氢键弱);(2)、3'端和5'端有直接重复序列的存在。有利于形成环状结构。6与转录有关的调控信号(1)、启动子(promoter)(2)、增强子(enhancer)(3)、负性调节元件(4)、LCR(Locusco

7、ntrolregions)(基因座调控区)(5)、转录因子(6)、与转录终止有关的序列:(7)、mRNA的剪接7内含子-外显子结构的统计研究10种真核生物的外显子和内含子数目及长度的统计结果比较(Deutsch&Long,1999)(外显子的长度单位是氨基酸,内含子的长度单位是核苷酸)平均每个基因包含外显子4.1个,内含子3.1个;基因中每1kb长的编码蛋白质区域(也称为CDS,CodingSequence)平均包含3.7个内含子.10种真核生物的外显子和内含子长度的统计分布(Deutsch&Long,1999)(外显子长度的

8、单位为氨基酸,内含子长度的单位为核苷酸;图中横坐标表示长度,纵坐标表示频率。)外显子长度概率分布曲线的山峰处于30~40个氨基酸长度的地方,且山峰比较紧凑,而内含子的长度则大多数为40~125个核苷酸,山峰相对平缓。人(Homosapiens)的基因组:平均每个基因包含内含子

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。