基因微阵列数据的双向聚类算法研究

基因微阵列数据的双向聚类算法研究

ID:32975171

大小:8.67 MB

页数:50页

时间:2019-02-18

基因微阵列数据的双向聚类算法研究_第1页
基因微阵列数据的双向聚类算法研究_第2页
基因微阵列数据的双向聚类算法研究_第3页
基因微阵列数据的双向聚类算法研究_第4页
基因微阵列数据的双向聚类算法研究_第5页
资源描述:

《基因微阵列数据的双向聚类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、苏州大学硕士学位论文基因微阵列数据的双向聚类算法研究姓名:张瑾申请学位级别:硕士专业:通信与信息系统指导教师:王加俊20080501基因微阵列数据的双向聚类算法研究摘要基因芯片是由大量DNA或寡核苷酸探针密集排列所形成的探针阵列。基因芯片上探针与经荧光标记的目标样品进行生物反应,利用专用芯片检测系统并借助于一定的软件即可得到基因表达数据。这个技术应用于不同发展阶段,不同人体组织,不同临床条件以及不同生物体等条件下的基因表达水平的测量。基因芯片的出现正在给生命科学研究’、疾病诊断、新药开发、食品卫生监

2、督等领域带来二场革命。本文的贡献主要体现在以下几个方面:首先,对基因数据分析中的一种双向聚类方法—格子模型法进行了深入的分析,并对其进行了改进。格子模型是一个混合有二进制变量和连续变量的模型。对于该模型,传统的用于连续变量的优化算法不再适用。为此,本文提出了一种新颖的神经网络方法来解决这种混合有二进制变量和连续变量的优化问题,并将该方法应用于酵母数据分析,实验结果表明使用这种方法后双聚类的精度得到了很大的提高。其次,本文还对基因数据分析的另一种方法非负矩阵分解方法进行了改进。传统的非负矩阵分解算法有

3、一定缺陷,其初始值是随机设定的,因此在迭代过程中会出现微小的抖动。为此本文在迭代计算过程中加入了数据平滑处理,并将该方法用于一组白血病微阵列数据分析。实验结果表明,改进过的非负矩阵分解算法提高了分类的准确率,同时这个方法避免了NMF算法的“零值”问题。第三,本文介绍了NNMF算法的基本原理,对其加入了一个平滑处理,增加了数据元素之间的联系,同时这个方法由于抬高了数据,避免了NMF算法中的“零值”问题。本文首次将NNMF算法应用于生物信息学中,用白血病微阵列数据进行了实验。实验结果表明,该方法提高了分

4、类的准确率及算法的收敛速度。关键词:基因数据分析,双向聚类,格子模型.,神经网络,非负矩阵因子分解,数据平滑处理作者:张瑾指导老师:王加俊一StudiesoiltheBiclu壁!生竖垒堕2生些里!鱼!鱼!呈!坚垄翌竺型里竺苎.一一垒;堕翌!!竺!—————————————————————————_—_——_———————————————————————————————一一一一ABSTRACTGenechipsarehighdensityprobearrayscomposedoflargeamoun

5、tofDNAoroligonucleotideprobes.Theprobesonthechiphybridizewiththefluorescentlymarkedtargetsamples.Thegeneexpressiondatacanbeobtainedbyusingthespecialchipsdetectionsystemsandwiththehelpofsomesoftware.Theapplicationsofsuchatechnologyareinmeasuringgeneexpr

6、essionlevelsindifferentdevelopmentalstages,differentbodytissues,differentclinicalconditionsanddifferentorganisms,etc.Genechipsarenowbringingagreatrevolutioninthefieldsoflifescienceresearch,diseasediagnosis,newdrugdevelopmentandfoodhygienesupervision.Th

7、econtributionsofthisthesisareasfollows:Firstly,anovelneural.networkapproachisproposedfortheplaidmodelwhereboththebinaryandcontinuousvariablesarecontainedandthetraditionallyusedoptimizationmethodsforproblemswithonlycontinuousvariables.cannotbeemployedfo

8、rit.Thismethodwasappliedtotheyeastdata.Experimentalresultsshowthattheaccuracyofthebiclusteringcallbesignificantlyimprovedwiththeproposedalgorithm.Secondly,animprovednon-negativematrixfactorization(NMF)algorithmwasproposed.Inourimproveda

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。