大规模表达序列标签测定及分析

大规模表达序列标签测定及分析

ID:40384300

大小:1010.10 KB

页数:54页

时间:2019-08-01

大规模表达序列标签测定及分析_第1页
大规模表达序列标签测定及分析_第2页
大规模表达序列标签测定及分析_第3页
大规模表达序列标签测定及分析_第4页
大规模表达序列标签测定及分析_第5页
资源描述:

《大规模表达序列标签测定及分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、大规模表达序列标签(EST)测定及分析中山大学生科院主要内容什么是EST?EST的应用EST序列测定及分析过程实例:家猪脑组织EST分析ESTs的来源上世纪80年代,对cDNA序列进行大规模测序的想法就曾提出,但对此一直存在争论,有人认为这种方法能发现成千上万的新基因;而反对者则认为cDNA序列缺少重要的基因调控区域的信息。90年代初GraigVenter提出了EST的概念,并测定了609条人脑组织的EST,宣布了cDNA大规模测序的时代的开始(Adamsetal.,1991)。●93年前ESTs数据收录于GenBank,EBI和DDBJ。●1993年NCBI(Natio

2、nalCenterofBiotechnologyInformation)建立了一个专门的EST数据库dbEST来保存和收集所有的EST数据。什么是ESTs?ESTs(ExpressedSequencetags)是从已建好的cDNA库中随机取出一个克隆,从5’末端或3’末端对插入的cDNA片段进行一轮单向自动测序,所获得的约60-500bp的一段cDNA序列。ESTs与基因识别ESTs已经被广泛的应用于基因识别,因为ESTs的数目比GenBank中其它的核苷酸序列多,研究人员更容易在EST库中搜寻到新的基因(Boguskietal.,1994).●在同一物种中搜寻基因家族的

3、新成员(paralogs)。●在不同物种间搜寻功能相同的基因(orthologs)。●已知基因的不同剪切模式的搜寻。【注:不过很难确定一个新的序列是由于交替剪切产生的或是由于cDNA文库中污染了基因组DNA序列(Wolfsbergetal.,1997)】ESTs与基因图谱的绘制EST可以借助于序列标签位点(sequence-taggedsites)用于基因图谱的构建.STS本身是从人类基因组中随机选择出来的长度在200-300bp左右的经PCR检测的基因组中唯一的一段序列。来自mRNA的3’非翻译区的ESTs更适合做为STSs,用于基因图谱的绘制。其优点主要包括:●由于没

4、有内含子的存在,因此在cDNA及基因组模板中其PCR产物的大小相同;●与编码区具有很强的保守性不同,3’UTRs序列的保守性较差,因此很容易将单个基因与编码序列关系非常紧密的相似基因家族成员分开。(JamesSikela等,1991年)GeneMap96‘定位了16,000个基于基因的STS(Schuleretal.,1996);GeneMap98’定位了30,000个基于基因的STS(Deloukasetal.,1998),而且基因图谱随着STS的定位正在不断的更新中。ESTs与基因预测由于EST来源于cDNA,因此每一条EST均代表了文库建立时所采样品特定发育时期和生

5、理状态下的一个基因的部分序列。使用合适的比对参数,大于90%的已经注释的基因都能在EST库中检测到(Baileyetal.,1998)。ESTs可以做为其它基因预测算法的补充,因为它们对预测基因的交替剪切和3‘非翻译区很有效。ESTs与SNPs来自不同个体的冗余的ESTs可用于发现基因组中转录区域存在的SNPs。最近的许多研究都证明对ESTs数据的分析可以发现基因相关的SNPs(Buetowetal.,1999;Gargetal.,1999;Marthetal.,1999;Picoult-Newbergetal.,1999)。应注意区别真正的SNPs和由于测序错误(EST

6、s为单向测序得来,错误率可达2%)而引起的本身不存在的SNPs。解决这一问题可以通过:●提高ESTs分析的准确性。●对所发现的SNPs进行实验验证。利用ESTs大规模分析基因表达水平因为EST序列是从某以特定的组织的cDNA文库中随机测序而得到,所以可以用利用未经标准化和差减杂交的cDNA文库EST分析特定组织的基因表达谱。标准化的cDNA文库和经过差减杂交的cDNA文库则不能反应基因表达的水平。◆CGAP为研究癌症的分子机理,美国国家癌症研究所NCI的癌症基因组解析计划(CancerGenomeAnatomyProject,CGAP)构建了很多正常的或是癌症前期的和癌症

7、后期的组织的cDNA文库,并进行了大规模的EST测序,其中大部分的文库未经标准化或差减杂交处理。CGAP网站提供了多种工具用以分析不同文库间基因表达的差异,如:●DigitalGeneExpressionDisplayer(DGED)●cDNAxProfiler◆基因表达系列分析(SerialAnalysisofGeneExpression,SAGE)基因表达系列分析是一种用于定量,高通量基因表达分析的实验方法(Velculescuetal.,1995)。SAGE的原理就是分离每个转录本的特定位置的较短的单一的序列标签(约9-

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。