国科大生物信息学

国科大生物信息学

ID:14770658

大小:31.04 KB

页数:22页

时间:2018-07-30

国科大生物信息学_第1页
国科大生物信息学_第2页
国科大生物信息学_第3页
国科大生物信息学_第4页
国科大生物信息学_第5页
资源描述:

《国科大生物信息学》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、{{{{1.***问题一:生物信息学的含义是什么?举一到两个例子说明你对生物信息学的哪方面感兴趣。它是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面。生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言,特别是非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测;其本质是识别基因信号。生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。它是本世纪自然科学和技术科学领域中“基因组、“信息结构”和“复杂性”这三个重大科学问题的有机结合。例子:怎样从新测得的

2、DNA序列中找到编码区?非编码区与编码区的差别是什么?非编码区有什么具体功能?RNAi现象对于细胞来说有着很重要的意义,包括基因表达的调控等等,那么都有哪些具体机制可以诱导正常细胞产生RNAi现象?SARS病毒的比较基因组研究;治疗SARS的RNAi设计;SARS蛋白的结构预测和模拟。}}}2.“Bioinformatics”一词(林华安定义):生物信息学是一门收集、分析遗传数据以及分发给研究机构的新学科(Bioinformaticsisanewsubjectofgeneticdatacollection,analysisanddisseminat

3、iontotheresearchcommunity)。3.人类基因组计划(美国三个国家计划曼哈顿计划、阿婆罗计划、人类基因组计划)。TheU.S.HumanGenomeProject:TheFirstFiveYearsFY1991-1995,byNIHandDOE(解读30亿字符)第二章:生物信息学的研究内容一几个经典课题1.大规模基因组测序中的信息分析(关键在拼接和注释)。大规模测序是基因组研究的最基本任务,它的每一个环节都与信息分析紧密相关。从测序仪的光密度采样与分析、碱基读出、载体标识与去除、拼接与组装、填补序列间隙、到重复序列标识、读框预测

4、和基因标注的每一步都是紧密依赖基因组信息学的软件和数据库的。2.如何在DNA序列中找到编码区域--基于信号或碱基组成***如何发现基因?基本原理是识别表征该基因的符号和组成特征。○1Bysignals作为参考信息AmongthetypesoffunctionalsitesingenomicDNAthatresearchershavesoughttorecognizearesplicesites,startandstopcodons,,promotersandterminatorsoftranscription,polyadenylationsite

5、s,ribosomalbindingsites,topoisomeraseIIbindingsites,topoisomeraseIcleavagesites,andvarioustranscriptionfactorbindingsites.Localsitessuchasthesearecalledsignalsandmethodsfordetectingthemmaybecalledsignalsensors.基因组DNA上能被识别的功能位点有剪切位点,起始和终止密码子,branchpoints,转录的启动子和终止子,多聚腺苷酸位点,核糖体结

6、合位点,拓扑异构酶II结合位点,拓扑异构酶I,和切割位点多种转录因子结合位点。这些位点被称为信号,检测它们的方法被称做信号传感器。第一、序列长度短,重复性大,假的比真的多百千倍,因而单独使用无法真正达到检测的目的。第二、信号模式不是唯一不变的,而是用概率来表示的。○2Bycontent更多依赖于I.StatisticalmethodandSequenceAlignmentMethodenevenpositionalbasefrequence(Dvalue)统计方法。编码区是三联体,将密码子翻译与天然蛋白的氨基酸序列进行比较(天然的蛋白质有固定的氨基

7、酸比例)。这种方法产生三种可能的氨基酸序列,若其中有一个非常像氨基酸序列,则另外两个都非常不像,则非常像的那个便是(与数据库进行比对,这种方法发现不了新蛋白)II.SequenceAnalysis–PairwiseAlignment双序列比对经典的双序列比对运用动态规划(DP)的形式,通过缓存亚问题的解决和重利用而不是重计算他们而解决一个最佳问题,运动DP的寻找两个长度为N的序列最佳排列将产生N2的亚问题。准确,但耗费计算机的资源。上述方法在序列很长时计算速度太慢,因此人们将之简化,发展处Heuristicschemes的方法。比较成熟的有FAST

8、A和BLAST。这种方法搜寻短序列不插入间隔。(序列比对(alignment):为确定两个或多个序列之间的相似性以至于同源

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。