基于自组织映射网络的数据挖掘算法研究及应用

基于自组织映射网络的数据挖掘算法研究及应用

ID:32975011

大小:1.33 MB

页数:58页

时间:2019-02-18

基于自组织映射网络的数据挖掘算法研究及应用_第1页
基于自组织映射网络的数据挖掘算法研究及应用_第2页
基于自组织映射网络的数据挖掘算法研究及应用_第3页
基于自组织映射网络的数据挖掘算法研究及应用_第4页
基于自组织映射网络的数据挖掘算法研究及应用_第5页
资源描述:

《基于自组织映射网络的数据挖掘算法研究及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、上海大学硕士学位论文基于自组织映射网络的数据挖掘算法研究及应用姓名:郝伟申请学位级别:硕士专业:计算机软件与理论指导教师:郁松年20060101上海大学硕士学位论文原创性声明本人声明:所呈交的论文是本人在导师指导下进行的研究工作。除了文中特J郅J/Jn以标注和致谢的地方外,论文中不包含其他人己发表或撰写过的研究成果。参与同一工作的其他同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。本论文使用授权说明期:丝兰l二本人完全了解上海大学有关保留、使用学位论文的规定,即:学校有权保留论文及送交论文复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容。(保密的论文在解密后应

2、遵守此规定)日期:掣上海大学硕士学位论文摘要在最近的二十年里.电子格式存贮的数据以惊人的速度激增,形成了海罱的数据和信息。数据挖掘是从大型数据库或数据仓库中发现并提取隐藏在其中的信息的一种新技术,包括统计学习和人工神经网络等方法。自组织映射网络是一种无监督学习的神经网络,在拓扑保持的同时,可以将高维的输入数据以低维的形式表达出来,故SOM可以作为一种可视化的方法,适用于对数据进行分析以提取有用的信息,由于SOM的这利,特性,在数据挖掘中广为应用。在本文中我们提出了一种用来进行数据分析聚类的新型白组织映射网络——GrowingHierarchicalSelf-OrganizingMap(GHS

3、OM),它的特点是不需要预先获知关于数据集的任何信息,在聚类的同时也将数据集的层次结构呈现出来。为了检验GHSOM对数据集类别和层次结构的揭示能力,我们使用GHSOM对高维数据——小鼠中枢神经系统数据集和酵母细胞周期数据集进行聚类利分类处理。最后通过与其他聚类算法的比较,说明了GHSOM本身具有比较理想的数据处理能力。本论文的主要贡献为:1)提出了一种新的白组织映射算法GHSOM;2)将GHSOM应用于微阵列数据的分析,来检验算法的有效性。关键词:数据挖掘,数据预处理,人工神经网络,自组织映射网络,微阵列上海大学硕士学位论文AbstractThepasttwodecadeshasseenad

4、ramaticincreaseintheamountofinformationordatabeingstoredinelectronicforrnat.Thisaccumulationofdatahastakenplaceatanexplosiverate.DataMiningjSthenontrivialextractionofimplicit.previouslyunknown.andpotentiallyusefulinfomaationfromdataThisencompassesanumberofdifferenttechnicalapproaches.suchasstatisti

5、clearning.artificialneuralnetworks.Self-OrganizingMaps(SOM)areunsupervisedlearningneuralnetworks.Theyprovideamappingfromhigh—dimensionaldataontoalowerdimensionaloutputmap,whilepreservingthetopologyoftheinputdataSOMvisualizationmethodsareusedtoextractknowledgeandusefulinformationfromthedataAccording

6、tothisprocess.theSOMiSextensivelyusedindataminingapplicationsWedevelopnovelSOMtechniquesfordataexplorationandclustering:anovelSOMmodelnamedGrowingHierarchicalSelf-OrganizingMap(GHSOM),whichisentirelydatadriven,requiringnospecification,thushelpstofindnotonlytheappropriatenumberofclustersbutalsothehi

7、erarchicalrelationsinthedataset,WeappliedtheGHSOMasclusteringandclassificationtoolsforseveralhigh—dimensionalapplications.ItwasappliedtoRatCentralNervousSystemdatasetandYeastCellCycledataset.Inbothofthetwod

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。