生物序列分析-中文

生物序列分析-中文

ID:46722687

大小:3.80 MB

页数:266页

时间:2019-11-27

生物序列分析-中文_第页
预览图正在加载中,预计需要20秒,请耐心等待
资源描述:

《生物序列分析-中文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、前前前言言言1992年在Snowbird举行的一个神经网络会议上,DavidHaussler和他加州大学圣克鲁斯分校(UCSC)的同事们(其中也包括本书作者之一AndersKrogh,AK)描述了使用概率论模型对蛋白质序列进行多序列联配建模的初步结果,他们称这种模型为隐马模型(HMM).随后他们技术报告的复本被广泛地传播开来,其中一些流传到剑桥大学的MRC分子生物学实验室.在那里RichardDurbin(RD)和GraemeMitchison(GJM)刚刚将自己的研究兴趣从神经建模转移到计算基因组序列分析上来.SeanR.Eddy(SRE)当时是该实验室的一名实验分子遗

2、传学背景的博士后学生,他对计算分析感兴趣.不久以后AK也到剑桥大学工作了一年.我们都快速地接受了概率论建模的思想,相信HMM及其随机文法对应物是优美的数学对象,而且十分适于提取埋藏在生物序列中的信息.圣克鲁斯小组和剑桥小组分别独立地开发了免费的HMM序列分析软件包,并分别独立地将HMM方法推广到用于进行RNA二级结构分析的随机上下文无关文法上.几乎与此同时,在喷气推进实验室/加州工学院(JPL/Caltech),由PierreBaldi领导的另一个小组也受Snowbird会议的成果所启发,进行基于HMM方法的研究.到1995年底,我们自认为在概率论建模技术方面已经掌握了比

3、较多的经验,但另一方面也感到学界内此方面工作的交流相对缺乏.虽然当时HMM已经引起广泛关注,但它仍被很多人视为数学黑匣而非序列联配问题的自然模型.许多详细描述HMM思想与方法的优秀文献仅限于语音识别领域,这使得大量计算生物学家望而却步.更重要的是,我们和其他几个小组都越发清晰的意识到HMM方法可以应用于更多问题,例如蛋白质结构建、基因识别和系统发育分析等多个领域.1995年圣诞节放假期间,可能有点被雄心壮志、天真幼稚和假期闲暇所“怂恿”,我们决定写一本关于生物序列分析的书,主要强调概率论建模在其中的应用.在过去的两年里,当初那个宏伟的写作计划已经逐渐被精炼成我们对于一本实

4、用书籍的期待.因为作者固执己见,所以本书带有很强的主观性,并非序列分析的实用指南.我们主要想对序列分析的基础进行通俗易懂地介绍,并向读者展示为什么我们觉得概率论建模方法是有用的.我们将尽量避免对特定计算机程序的讨论,与此相对,本书把更多的笔墨花费在程序背后的算法与原理上.我们仔细地引用了大量学者的工作,我们的见解深受其影响.但可以确信其中必有遗漏,这些文献我们本该阅读,我们对此致以歉意.同时,本书内容必须涉及从进化生物学到概率论、再到生物物理学的诸多研究领域,受时间、精力以及作者理解能力的限制,我们处理一些问题时难免肤浅.计算生物学是一门交叉学科.包括我们在内,研究者来自

5、不同的研究背景,例如分子生物学、数学、计算机科学以及物理学.本书设想的读者是背景为这些学科之一的研究生或高年级本科生.我们力求简洁而直观地呈现本书内容,尽量避免令人望而生畏的数学推导或过于技术性的生物学细节.我们假设读者已经熟悉分子遗传学的基本原理,例如DNA到RNA到蛋白质的中心法则,再例如核酸是由四种核苷酸子单元组成的序列,蛋白质是由二十种氨基酸组成的序列.必要时本书会给出分子遗传学的更多细节.我们也假设读者具备一定的数学基础.然而本书的部分章节仍包含一些数学性很强的描述.我们已经尝试将这些内容安排在每章的最后,并作为整体安排在全书的末尾.特别是最后一章,第11章涵盖

6、了概率论中与本书前面许多内容相关的主题.我们向爽快地接受邀请并对本书部分手稿进行校对的人们表达自己的感激之情.我们特别感谢EwanBirney、BillBruno、DavidMacKay、CathyEddy、Jotunvvi前言Hein和S¿renRiis.BretLarget和RobertMau提供了他们一直在系统发育研究中使用的抽样方法的信息,这些信息十分有帮助.DavidHaussler勇敢地将本书尚未成熟的手稿作为1996年秋季的课堂讲义在UCSC讲授,同时我们也十分感谢David以及他的整个班级提供了宝贵的反馈信息.我们也要感谢David从一开始就将我们引入了这

7、个研究领域.在刊印本书的过程中,我们与剑桥大学出版社的DavidTranah及MariaMurphy还有SG出版公司的SueGlover合作得十分愉快.虽然本书充满方程、算法和伪代码,但在编辑本书以及为本书进行LATEX排版方面他们表现了非凡的业务能力;他们对于我们异常乐观并毫无精准可言的时间表也展示出非凡的容忍.书中难免存在错误,但若没有以上所有人的努力,相信错误的数量会更多.我们也希望感谢为本书及相关工作提供资助的个人与集体,他们包括维康基金会(WellcomeTrust),美国国家健康总署国家人类基因组研究所(NIHNa

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。