基于谱图理论基因表达谱数据分析

基于谱图理论基因表达谱数据分析

ID:32296201

大小:4.67 MB

页数:52页

时间:2019-02-02

基于谱图理论基因表达谱数据分析_第1页
基于谱图理论基因表达谱数据分析_第2页
基于谱图理论基因表达谱数据分析_第3页
基于谱图理论基因表达谱数据分析_第4页
基于谱图理论基因表达谱数据分析_第5页
资源描述:

《基于谱图理论基因表达谱数据分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、安徽大学硕士学位论文摘要利用DNA芯片,可以对成千上万个基因在不同组织的表达情况进行跟踪与监测,它不仅有助于肿瘤组织的鉴别分类和新亚型发现,而且为肿瘤分子生物学的研究提供了强大而有效的科学依据。随着DNA芯片技术的发展,基因表达谱数据的获取变得更加容易,使得人们开始在分子水平上研究肿瘤是否发生以及相应的病变机制;同时通过基因表达谱数据分析可以帮助找出与肿瘤相关的致病基因,从而为针对性的肿瘤诊断和治疗提供一种全新的方法。本文基于谱图理论,研究了肿瘤基因表达谱数据,通过构图实现无结构信息的数字序列到具有结构信息的图结构的转变,

2、并分别用无监督、半监督和有监督的方法实现了基因表达谱数据的聚类或分类,同时分析了相应的实验结果。主要研究内容如下:1.针对基因表达谱数据的高维小样本特性,提出一种基于NormalizedCut的基因表达谱数据聚类方法。该方法首先将肿瘤样本作为图中的节点,并构建正规Laplacian矩阵;然后对Laplacian矩阵进行SVD分解,以获取反映可以样本类别信息的指示向量;最后通过指示向量各分量的符号差异实现数据类别的划分。通过对白血病和结肠癌数据集的实验,证明了该方法的有效性。2.针对原始标记传播算法重复标记样本点和阈值选取的

3、不确定性等问题,提出一种基于雅可比迭代的标记传播算法,并将其应用于基因表达谱分析中。该方法首先标记少量已知类别的样本,并定义一个表示样本类别属性的标记序列,然后通过传播标记的方式来识别未知类别的样本。在传播过程中,某个未知样本的标记值根据其余所有样本当前标记值的加权平均进行更新;同时,已知样本的标记值始终维持其初始标记水平,以保证标记数据的强度。最后,证明了标记序列的收敛性并得到相应的收敛解。通过白血病和结肠癌数据集的实验,证明了该方法的有效性。3.针对拉普拉斯特征映射(LE)和最大边缘准贝JJ(MMC)在特征提取问题中存

4、在的不足,提出一种基于LE和改进MMC(LE/IMMC)的特征提取算法,并将其应用于基因表达谱数据分类。LE/IMMC算法以保持相似数据点的近邻关系,且最大化类间边缘为目标,将基于类间散度与类内散度差最大化的IMMC标准引入到LE的价值函数中,因此保持了LE所具有的局部近邻关系,同时利用IMMC安徽大学硕士学位论文基于谱图理论的基因表达谱数据分析增强了分类判别信息。通过在四组公开的基因表达谱数据集上的分类实验,证明了该方法的有效性。关键词:基因表达谱,归一化割,标记传播,Laplacian特征映射,最大边缘准则II安徽大学

5、硕:I:学位论文AbstractTheexpressionleveloftensofthousandsofgenesindifferenttissuesCanbetrackedandmonitoredusingDNAchip.Itnotonlycontributestoidentifyingandclassifyingthetumortissues,butalsoprovidespowerfulandefficientscientificbasisfortheresearchoftumormolecularbiology.

6、WiththedevelopmentofDNAchiptechnology,theaccessofgeneexpressionprofiledatabecomemucheasierandtheoccurrenceoftumorandcorrespondingpathogenesisCanberesearchedatmolecularlevel.Meanwhile,theanalysisofgeneexpressionprofiledataishelptofindoutthetumorrelatedgenes,whichpr

7、ovidesanewmethodfortargetedtumordiagnosisandInthisarticle,tumorgeneexpressionprofiledataWasresearchedbasedonspectralgraphtheory.Bymeansofgraphconstruction,thedigitalsequencewithoutstructuralinformationCanbetranslatedintothegraphstructure、析thstructuralinformation.T

8、hetumorsampleswereclassifiedbytheclusteringorclassificationmethodandthecorrespondingexperimentalresultswereanalysedsimultaneously.Themainresearchcontent

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。