生物信息学在人类基因组计划中的应用

生物信息学在人类基因组计划中的应用

ID:8930534

大小:39.00 KB

页数:13页

时间:2018-04-12

生物信息学在人类基因组计划中的应用_第1页
生物信息学在人类基因组计划中的应用_第2页
生物信息学在人类基因组计划中的应用_第3页
生物信息学在人类基因组计划中的应用_第4页
生物信息学在人类基因组计划中的应用_第5页
资源描述:

《生物信息学在人类基因组计划中的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、生物信息学在人类基因组计划中的应用作者:佚名来源:生命经纬2005-4-816:03:00生物信息学是当前生物学领域的研究热点,预计在未来的若干年它将变得越来越重要、越来越引起人们的重视。近期任务由于未来几年蛋白质和核酸的测序数据将以指数方式增加,近期生物信息学将在以下几方面迅速发展:大规模基因组测序中的信息分析大规模测序是基因组研究的最基本任务,它的每一个环节都与信息分析紧密相关。目前,从测序仪的光密度采样与分析、碱基读出、载体标识与去除、拼接与组装、填补序列间隙,到重复序列标识、读框预测和基因标注的每一步都是紧密依赖

2、基因组信息学的软件和数据库的。特别是拼接和填补序列间隙更需要把实验设讨和信息分析时刻联系在一起.拼接与组装中的难点是处理重复序列,这在含有约30%重复序列的人类基因组中显得尤其突出。新基因和新SNPs(单核苷酸多态性)的发现与鉴定人类基因组的工作草图即将完成,因此发现新基因就成了当务之急。使用基因组信息学的方法通过超大规模计算是发现新基因的重要手段,可以说大部分新基因是靠理论方法预测出来的。比如啤酒酵母完整基因组(约1300万bp)所包含的6千多个基因,大约60%是通过信息分析得到的。当人类基因找到之后,自然要解决的问题

3、是:不同人种间基因有什么差别;正常人和病人基因又有什么差别。”这就是通常所说的SNPs(单核苷酸多态性)。构建SNPs及其相关数据库是基因组研究走向应用的重要步骤。1998年国际已开展了以EST为主发现新Spps的研究。在我国开展中华民族SNPs研究也是至关重要的。完整基因组的比较研究现在,生物信息学家不仅有大量的序列和基因而且有越来越多的完整基因组。有了这些资料人们就能对若干重大生物学问题进行分析,比如:研究生命是从哪里起源的?生命是如何进化的?遗传密码是如何起源的?估计最小独立生活的生物至少需要多少基因,这些基因是如

4、何使它们活起来的?比如,鼠和人的基因组大小相似,都含有约三十亿碱基对,基因的数目也类似。可是鼠和人差异确如此之大,这是为什么?同样,有的科学家估计不同人种间基因组的差别仅为0.1%;人猿间差别约为I%。但他们表型间的差异十分显著。因此其表型差异不仅应从基因、DNA序列找原因,也应考虑到整个研究组、考虑染色体组织上的差异。总之,这些例子说明由完整基因组研究所导致的比较基因组学必将为基因组研究开辟新的领域。大规模基因功能表达谱的分析随着人类基因组测序逐渐接。近完成、一些学者就提出如下的问题:即使我们已经获得了人的完整基因图谱

5、,那我们对人的生命活动能说明到什么程度呢?于是他们提出了一系列由上述数据所不能说明的问题,例如:基因表达的产物是否出现与何时出现;基因表达产物的浓度是多少;是否存在翻译后的修饰过程,若存在是如何修饰的;基因敲出(knock-out)或基因过度表达的影响是什么;多基因的表现型如何,等。概括这些问题,其实质应该是:我们虽然知道了基因,知道了核酸序列,但我们不知道它们是如何发挥功能的,或者说它们是如何按照特定的时间、空间进行基因表达的,表达量有多少。为了得到基因表达的功能谱,国际上在核酸和蛋白质两个层次上都发展了新技术。这就是

6、在核酸层次上的DNA芯片技术和在蛋白质层次上的二维凝胶电泳和测序质谱技术,也称蛋白质组技术。生物大分子的结构模拟与药物设计随着人类基因组计划的执行,估计几年之内就可找到人类的8万到10万个基因,也就是发现它们的一级序列。然而要了解他们的功能、要找到这些蛋白质功能的分子基础,必须进一步知道它们的三维结构。与此同时,要设计药物也需要了解相应的蛋白质受体的三维结构。这是摆在科学家面前的紧迫任务。远期任务生物信息学的远期任务是读懂人类基因组,发现人类遗传语言的根本规律。从而阐u若干生物学中的重大自然哲学问题,像生命的起源与进化等

7、。这一研究的关键和核心是了解非编码区。非编码区信息结构分析近年来完整基因组的研究表明,在细菌这样的微生物中非编码区只占整个基因组序列的10%到20%。而高等生物和人的基因组中非编码区都占到基因组序列的绝大部分。从生物进化的观点看来,随着生物体功能的完善和复杂化非编码区序列明显增加的趋势表明:这部分序列必定具有重要的生物功能。普遍的认识是,它们与基因在四维时空的表达调控有关。因此寻找这些区域的编码特征以及信息调节与表达规律是未来相当长时间内的热点课题。对人类基因组来说,迄今为止,人们真正掌握规律的只有DNA上的编码蛋白质的

8、区域(基因),很多资料说u这部分序列只占基因组的3%到5%,也就是说,人类基因组中多达95%到97%是非编码区。如何深人了解这些非编码区序列的功能是当前科学家们面临的一个真正的挑战。遗传密码起源和生物进化的研究自1859年Darwin的物种起源发表以来,进化论成为对人类自然科学和自然哲学发展的最重大贡献之一。进化论研

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。