多重序列比对和基因芯片数据分析

多重序列比对和基因芯片数据分析

ID:33104600

大小:2.08 MB

页数:77页

时间:2019-02-20

多重序列比对和基因芯片数据分析_第1页
多重序列比对和基因芯片数据分析_第2页
多重序列比对和基因芯片数据分析_第3页
多重序列比对和基因芯片数据分析_第4页
多重序列比对和基因芯片数据分析_第5页
资源描述:

《多重序列比对和基因芯片数据分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要随着人类基因组(测序)计划(HumangenomeProjec七)的实现以及分子生物学相关学科的迅猛发展,越来越多的动植物、微生物基因组序列得以测定,基因序列数据正在以前所未有的速度迅速增长.与此同时综合了分子生物学,半导体微电子,激光,化学染料等领域的最新科学技术的基因芯片,也在以其无可比拟的信息量、高通量、快速、准确地分析基因的能力,也在基因功能研究、临床诊断及新药开发等方面显示了巨大的潜能.而生物信息学分析是大规模基因信息(序列信息,表达信息)分析的主要方法.本文主要结果由两部分组成:第一部分是针对基因序列的快速多重比对算法及应

2、用.论文的第一和第二章针对基因序列的多重序列的比对问题,根据序列突变与比对的”模代数”结构理论[l],并在序列两两比对的基础上,应用系统聚类等方法,给出了同源多重序列的超级快速比对算法(简称SMA).该算法可适用于大规模(如。>50,n>10Kbp)的同源多重序列的比对计算,SMA的程序和测试数据我们已在网上公布,并提供比对计算服务我们分别对83x30Kbp的SARS序列与706x10Kbp的Hl从1序列进行比对,主频3刀GPC机上完成多重比对的计算时间分别为21分钟与34小时,SMA算法在速度上对HMMER有明显优势,而且根据相似比等各

3、项优化指标测试,结果不差于HMMER.多重序列在完成比对后,对序列的结构分析是多重序列比对后的主要与关键问题.论文的第三章给出了利用突变网络理论来研究多重比对后基因的突变分析.利用该理论和正交化方法来研究基因突变,我们可以得到基因组多重序列比对的突变过程更清楚的描述.我们以SARS病毒基因组为例,说明它们的突变网络系统模型与正交化运算,绘制了SAB另基因突变图,并由此得到SARS病毒从早期传播到爆发的基因突变过程第二部分是针对基因芯片表达数据的聚类算法和网络调控分析.第四章针对乳腺癌在转移过程中的基因表达特征的聚类分析法分析,我们改进了k

4、-mean:聚类算法,给出了kr一means算法,使之具有自动搜索聚类数的功能,并且有助于改善k-means算法的聚类结果陷入最小值的状况.通过对平均聚类误差指标的比较,kr一means要明显优于k-means算法.本文所得到的结果可供乳腺癌诊断与病变分析参考,同时可以应用于小型基因检测芯片的制备,也可以用于构建基因网摘要络调控图.第五章针对表达数据提取基因调控矩阵从而构建基因网络的问题,我们通过线性微分方程模型可以初步构建基因网络,了解网络结构,提取最显著的信息.然而由于分子生物学的条件限制或者数据来源的限制,导致实验数据不充分,使方程

5、组无解.我们使用三次样条方法,对26例临床、病理资料完备的具有淋巴结转移的乳腺癌基因表达数据进行插值处理,使表达数据满秩,从而使用最小二乘法解出加权矩阵,构建初步的表达基因调控网络.通过对构建的基因网络的初步生物学和医学分析表明:乳腺癌转移的形成是由多基因异常引起多条传导通路异常,致使细胞恶性转化的结果,这与生物学上公认的看法是相一致的.利用此线性模型方法对基因表达谱进行分析具有一定可行性,在认识乳腺癌转移机制,乳腺癌诊断和治疗方面具有一定的理论和应用价值.关链词:多重比对算法,大规模基因组比对,突变网络分析,基因芯片表达数据分析,聚类分

6、析,调控网络分析ABSTRACTTOcomParelargenulllbersof罗nomicsequencesofrelatedvirussuchasHIV,bio1ogjstShaveanincreasingneedforamethodthatcan确cj即tlyha刀dlehUll-dreds,evnthousands,ofgenonucse明encesacuratelyenoughtocorrectlyali,theseconservedfe助ures.InthelstZndch即ter,weintroducean脚andefic

7、ienttooInamedSMAthatcaneasiIyaccommodateIarge-scalevirusgenomicseq11ences.Ahig卜throughPutteston706HIV-lgeno而csequencesshowsthatSMAismuchfasterthanthe~lablepro歹妙withatle韶tthes脚eperformance.SMAisa即odimprovementof印stingalgorithmsforhigh一volumemultiplesequencealign-mellt.Itof

8、ersanoptionthatProvidesimprovedsPeedandaccur朗ycomParedwithcurrentlyavilableProgran‘.B留edonmuitiP

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。