基因微阵列数据的分析算法

基因微阵列数据的分析算法

ID:32054699

大小:1.97 MB

页数:66页

时间:2019-01-31

基因微阵列数据的分析算法_第1页
基因微阵列数据的分析算法_第2页
基因微阵列数据的分析算法_第3页
基因微阵列数据的分析算法_第4页
基因微阵列数据的分析算法_第5页
资源描述:

《基因微阵列数据的分析算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、堆

2、大I微阵列数据的分析算法摘爨基因微阵列数据的分析算法中文摘要基因微阵列(又称基因芯片)可应用对于不同发展阶段,不同人体组织,不同临床条件以及不同生物体等条件下的基因表达水平的测量。基因芯片的出现正在给生命科学研究、疾病诊断、新药丌发、食品卫生监督等领域带来一场革命。与此同时,由基因微阵列技术带来的海量数据也对传统的信息处理技术带来了很大的挑战。鉴于此,本文对基因微阵列的预处理和聚类算法进行了研究。本文的主要贡献如下:首先,提出了一种改进的稳健Lowcss算法,对基因微阵列的数掘进行标准化处理。该算法首先利用局部加权线性回归对数据点进行平滑估计,然后再利用核估计算法对误差项进行估计,以进一步

3、减小误差,最后对每个格子罩的数据点进行缩放处理。实验证明了本文算法的高效性。其次,本文提出了一种新的基因表达矩阵的缺失值估计算法。该算法首先利用迭代的K-means算法来挑选无缺失基因,再用James-Stein估计算法并结合核估计算法得出最后的估计值。实验证明该算法在低缺失率的时候优于其它传统估计算法。再次,本文对模糊谱双向聚类算法进行了改进。虽然模糊谱双向聚类算法能够取得不错的效果,但是由于其使用的FCM算法对数据类型的敏感性及其局部搜索能力,限制了它的使用,因此本文应用GG算法和遗传算法来改进原算法的局限性。实验证明本文改进算法的优越性。最后,本文提出了一种基于基因和条件提取的双向聚类算

4、法。该算法利用央角余弦法排除那些对聚类结果贡献小的表达数据,使得聚类只在提取的基因和条件中进行,从而降低了计算复杂度。实验证明本文算法优于其它算法。关键词:基因微阵列;标准化;James-Stein估计;核估计;双向聚类作者:严德春指导教师:王加俊AlgorithmsforGeneMicroarrayDataAnalysisAbstractGeneMicroarray(alsoreferredtoasGenechips)canbeusedinmeasunnggeneexpressionlevelsindifferentdevelopmentalstages,differentbodytissu

5、es,differentclinicalconditionsanddifferentorganisms,etc.Genechipsarenowbringingagreatrevolutlonmthefieldsoflifescienceresearch,diseasediagnosis,newdrugdevelopmentandfoodhygienesupervision.Meanwhile,themassiveGeneMicroarraydataalsobringg删challengestothetraditionaltechniquesofinformationprocessing.The

6、refore,thisthesisfocusesondevelopingalgorithmsforpre-processingandbiclusteringoftheGeneMicroarraydata.Thecontributionsofthisthesisareasfollows:Firstly,锄improvedversionoftherobustLowessnormalizationisproposedfortheno咖alizationoftheGeneMicraoarraydata.Inthisalgorithm,thedataarefirstlysmoothedwiththelo

7、callyweightedlinearregressionmethod,thentheerrorisfunher砌ucedbyestimatingtheresidueinsmoothingestimationinaframeworkofkemelestimation.finally,scalingoperationisperformedwithrespecttoeachdatap0Intonthegrid.Experimentalresultsshowbotheffectivenessandefficiencyofthisalg耐thm·Secondly'anovelstrategyfores

8、timatingthemissingdatainthegeneexpresslonm撕xispresented.ThealgorithmisbasedontheJames--Steinandkernelestlmatlonprincipleswheretheestimationmatrixisobtainedwiththek-meansalgorithm·ExperimentalresuItssh

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。