基于表达数据和基因组信息分析基因调控的方法学研究

基于表达数据和基因组信息分析基因调控的方法学研究

ID:36745015

大小:8.53 MB

页数:104页

时间:2019-05-14

基于表达数据和基因组信息分析基因调控的方法学研究_第1页
基于表达数据和基因组信息分析基因调控的方法学研究_第2页
基于表达数据和基因组信息分析基因调控的方法学研究_第3页
基于表达数据和基因组信息分析基因调控的方法学研究_第4页
基于表达数据和基因组信息分析基因调控的方法学研究_第5页
资源描述:

《基于表达数据和基因组信息分析基因调控的方法学研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中文摘要题名:基于表达数据和基因组信息分析基因调控的方法学研究博士研究生姓名:谢建明导师姓名:陆祖宏(教授)学校名称:东南大学后基因组时代,高通量数据的产生和分析是生物医学研究中的一个重要现象和重要任务,因此面向全基因组数据的分析方法研究和工具开发应是生物信息学的重要研究内容之一。基因调控网络或者基因之间的相互关系研究是生物医学研究的重要内容,有助于揭示疾病的分子机制,为疾病的早期诊断和治疗、预防和预后提供有效的分析策略和技术支持。论文选择微阵列基因表达数据、基因组序列数据以及全基因组注释信息为分析对象,以发现基因之间的相互关系,特别是基因调控关系为目的

2、,研究数据整合分析方法,并开发相应的工具,为基因调控的研究提供技术支持。总结本论文的主要工作和所取得结果如下:(1)分析基因表达数据,确定基因之间的共表达关系。包括3个工作。将模糊聚类分析方法引入到基因表达数据分析中,并应用于酵母细胞周期表达数据的分析,分析得到的两类基因分别参与了G1/S和G2/M期的细胞生理过程,这些共表达基因很好地描述了细胞周期中的分子过程。结果表明了模糊聚类分析算法能够提取有用的生物信息,有助于生物学知识的发现。基于共表达基因是共调控的假设,对聚类分析得到的酵母共表达基因进行了启动子区转录因子结合位点的预测工作,找到了一些转录因子

3、结合位点,与现有的认识相一致,表明可以通过共表达基因来确定转录因子结合位点,进而找到转录因子,确定基因之间的调控关系。基于分子网络模块化和基因按需表达的假设,提出了基于秩和样本重排检验思想的跨平台分析方法,并用于小鼠造血干细胞定向分化血细胞的基因表达数据分析,分析了不同参数对结果的影响,并选择一组参数进行了条件特异基因差异表达分析,有效地提取了一组基因,它们反映出T细胞发育过程和B细胞发育过程中的共同分子过程和特异分子过程。(2)分析基因组序列和注释信息,确定基因之间的调控关系。利用转录因子结合位点进行全基因组扫描,结合GO注释信息预测靶基因,认识基因之

4、间的调控关系。对转录因子NF-r.B和AP.1结合位点进行了基于一致序列和特定motif的扫描,分析了在人全基因组上的分布特点,NF.rd3结合位点的一致序列在启动子区的转录起始位点上游300bp内出现明显的高峰,表明了TFBS在启动子区的富集,与一般认识相符。AP.1结合位点motif“TGCGTCA’’也表现出类似的分布,但是AP.1结合位点的其它motif在启动子区的分布是接近均匀的。全基因组扫描分析显示转录因子结合位点的不同motif具有不同的分布特点,在基因组上的频率可以相差10倍以上,在基因各结构区也不是对称的。对扫描结果进行了基因注释,分析

5、了已知靶基因的GO注释以及motif在启动子区的分布特点和聚集特性,利用这些信息预测了NF.r,B和AP.1的靶基因,并利用文献挖掘分析工具,表明部分预测靶基因与转录因子存在密切关系,为实验验证提供了有效的线索。(3)基于GO术语的基因产物语义相似度分析基因之间的关联关系。语义相似度计算的基本思想是基于GO图结构信息或者基于GO术语的信息量信息,选择酵母基因和AP,1相关基因,采用多种算法进行了GO语义相似度计算,结果表明应用语义相似度可以进行基因相关性分析,路径参与基因之间的语义相似度要显著高于任意基因之间的语义相似度,酵母基因分析的结果要优于AP.1

6、路经基因的分析结果,这与酵母基因和人类基因的GO注释质量有关。分析还表明了不同算法得到的结果有较大的差异,提示了算法选择的重要性,而整合多种算法进行分析将是更好的一种选择。(4)全基因组分析对于计算复杂度和后续信息分析都是一个挑战,在算法研究的基础上,面向具体的生物医学应用,开发了基因表达数据分析软件、转录因子结合位点扫描和注释软件、基于秩的跨平台条件特异表达分析程序和基于GO术语的基因产物语义相似度计算程序。上述软件和程序可以在http://www.1mbe.seu.edu.cn/~xjm/program.html一下载。论文在面向生物医学应用进行工具

7、开发上进行了尝试,试图有机地把两者结合起来,以生物医学问题为主导,整合多种数据进行分析。关键词:基因表达模糊聚类分析转录因子结合位点GO术语微阵列语义相似度跨平台基因表达数据分析生物信息学IIAbstractTHESISTITLE:BioinformaticsofgeneregulationbasedongeneexpressiondataandgenomicanalysisDOCTORCANDIDATE:XIEJian-mingSUPERVISOR:LUZu-hong(Professor)SCHOOL:SoutheastUniversityInthep

8、ost-genomicera,ahugeamountofbiologicalda

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。