核酸和蛋白质序列分析

核酸和蛋白质序列分析

ID:9990367

大小:26.70 KB

页数:5页

时间:2018-05-20

核酸和蛋白质序列分析_第1页
核酸和蛋白质序列分析_第2页
核酸和蛋白质序列分析_第3页
核酸和蛋白质序列分析_第4页
核酸和蛋白质序列分析_第5页
资源描述:

《核酸和蛋白质序列分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、核酸和蛋白质序列分析     在获得一个基因序列后,需要对其进行生物信息学分析,从中尽量发掘信息,从而指导进一步的实验研究。通过染色体定位分析、内含子/外显子分析、ORF分析、表达谱分析等,能够阐明基因的基本信息。通过启动子预测、CpG岛分析和转录因子分析等,识别调控区的顺式作用元件,可以为基因的调控研究提供基础。通过蛋白质基本性质分析,疏水性分析,跨膜区预测,信号肽预测,亚细胞定位预测,抗原性位点预测,可以对基因编码蛋白的性质作出初步判断和预测。尤其通过疏水性分析和跨膜区预测可以预测基因是否为膜蛋白,这对确定实验研究方向有重要的参考意义。此外,通

2、过相似性搜索、功能位点分析、结构分析、查询基因表达谱聚簇数据库、基因敲除数据库、基因组上下游邻居等,尽量挖掘网络数据库中的信息,可以对基因功能作出推论。上述技术路线可为其它类似分子的生物信息学分析提供借鉴。本路线图及推荐网址已建立超级链接,放在北京大学人类疾病基因研究中心网站(http://gene.bjmu.edu.cn/science/bioinfomatics.htm ),可以直接点击进入检索网站。  下面介绍其中一些基本分析。值得注意的是,在对序列进行分析时,首先应当明确序列的性质,是mRNA序列还是基因组序列?是计算机拼接得到还是经过PC

3、R扩增测序得到?是原核生物还是真核生物?这些决定了分析方法的选择和分析结果的解释。(一)核酸序列分析1、双序列比对(pairwisealignment)   双序列比对是指比较两条序列的相似性和寻找相似碱基及氨基酸的对应位置,它是用计算机进行序列分析的强大工具,分为全局比对和局部比对两类,各以Needleman-Wunsch算法和Smith-Waterman算法为代表。由于这些算法都是启发式(heuristic)的算法,因此并没有最优值。根据比对的需要,选用适当的比对工具,在比对时适当调整空格罚分(gappenalty)和空格延伸罚分(gapext

4、ensionpenalty),以获得更优的比对。   除了利用BLAST、FASTA等局部比对工具进行序列对数据库的搜索外,我们还推荐使用EMBOSS软件包中的Needle软件(http://bioinfo.pbi.nrc.ca:8090/EMBOSS/),和PairwiseBLAST(http://www.ncbi.nlm.nih.gov/BLAST/)。以上介绍的这些双序列比对工具的使用都比较简单,一般输入所比较的序列即可。(1)BLAST和FASTA   FASTA(http://www.ebi.ac.uk/fasta33/)和BLAST(h

5、ttp://www.ncbi.nlm.nih.gov/BLAST/)是目前运用较为广泛的相似性搜索工具。这两个工具都采用局部比对的方法,选择计分矩阵对序列计分,通过分值的大小和统计学显著性分析确定有意义的局部比对。使用FASTA和BLAST,进行数据库搜索,找到与查询序列有一定相似性的序列。一般认为,如果蛋白的序列一致性为25-30%,则可认为序列同源。BLAST根据搜索序列和数据库的不同类型分为5种(表2),另外PSI-BLAST通过迭代搜索,可以搜索到与查询序列相似性较低的序列。其中BLASTN、BLASTP在实践中最为常用,TBLASTN在搜

6、索相似序列进行新基因预测时特别有用。   使用BLAST时,先选择需要使用的BLAST程序,然后提供相应的查询序列,选择所比对的数据库即可。(2)Needle和PairwiseBLAST:其中Needle适用于蛋白质和DNA序列,而PairwiseBLAST仅适用于DNA序列(3)相似性和同源性:必须指出,相似性(similarity)和同源性(homology)是两个完全不同的概念。同源序列是指从某一共同祖先经过趋异进化而形成的不同序列。相似性是指序列比对过程中检测序列和目标序列之间相同碱基或氨基酸残基序列所占比例的大小。经过比对,当相似性高于一

7、定程度,可以推测序列可能是同源序列,具有一定同源性。2、多序列比对和进化树   在研究生物问题时,常常需要同时对两个以上的序列进行比对,这就是多序列比对。多序列比对可用于研究一组相关基因或蛋白,推断基因的进化关系,还可用于发现一组功能或结构相关基因之间的共有模式(pattern)。最常用的多序列比对工具为ClustalW(http://www.ebi.ac.uk/clustalw/),多用于比较蛋白序列。ClustalW用法:(1)输入:序列以FastA格式输入。(2)输出:除了以文本形式外,还可以通过JalView显示和编辑结果。此外,还可以另外

8、使用GeneDoc(常见于文献)及DNAStar软件等显示结果。多序列比对的结果还用于进一步绘制进化树。3、ORF(Ope

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。