基于进化多目标及聚类集成自动聚类算法

基于进化多目标及聚类集成自动聚类算法

ID:32431645

大小:4.21 MB

页数:62页

时间:2019-02-04

基于进化多目标及聚类集成自动聚类算法_第1页
基于进化多目标及聚类集成自动聚类算法_第2页
基于进化多目标及聚类集成自动聚类算法_第3页
基于进化多目标及聚类集成自动聚类算法_第4页
基于进化多目标及聚类集成自动聚类算法_第5页
资源描述:

《基于进化多目标及聚类集成自动聚类算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要摘要随着数据库技术以及网络信息技术的迅猛发展,人们可以非常方便地获取大量的数据。如何从这些获取的大量数据中,得到有用的或者潜在的信息成为一个急需要解决的问题。数据挖掘是信息技术发展的一个非常重要的分支。而数据挖掘中的聚类技术就是随着海量数据的信息处理运用而生的。数据聚类一般是无监督的,这是比较符合现实情况的,因为在很多情况下,我们往往无法得到关于数据的任何先验信息。聚类分析的广泛用途决定了它必定成为广大学者研究的热点。基于上述的背景,本文分别提出了基于新的交叉算子的多目标聚类算法,以及基于四目标的多目标聚类集成算法。具体工作如

2、下:1.提出了一种基于新的交叉算子的多目标聚类算法。算法中,根据聚类集成算法的框架,提出了新的交叉算子。其次,为了提高算法的性能,在该算法中,加入了新的操作算子即采用不同算法对数据子空间进行搜索,从而提高了搜索解的质量。在实验部分,分别对26个基因数据集以及5个UCI数据集进行了测试,并且与类似的几个多目标聚类算法进行了对比,实验结果表明新提出的算法在获取高质量的聚类划分方面具有较大的优势。2.提出了一种基于四目标优化的聚类集成算法。在该算法中,首先针对第一个工作中新提出的的交叉算子进行改进。其次,在第一个工作的三个目标基础上增加

3、了一个新的目标函数。这个目标函数代表了待评价个体与种群中其他个体之间的相似性。引入该函数的优点有以下三个:第一,保持种群的多样性:第二,保持好的个体;第三,由于算法涉及到聚类集成算法,而该目标函数可以保证种群多样性,一个具有适度多样性的种群对于聚类集成算法产生好的解也有着至关重要的作用。在实验部分,依然对26个基因数据集以及5个常用到的UCI数据集进行测试。实验结果表明新提出的算法在大部分数据集上都取得了不错的效果,与对比算法比较,具有较大的优势。本课题得到国家自然科学基金(No.60803098)、国家教育部博士点基金(No.2

4、0070701022)、省自然科学基金(2010JM8030)、中央高校基本科研基金(No.K50511020014)的资助。关键词:多目标优化机器学习聚类集成ABSTRACTABSTRACTWiththerapiddevelopmentofdatabaseandnetworkinformationtechnology,lotsofdataCanbeheldeasily.Howtogetusefulinformationfromtheselargeamountsofdatabecomesanurgentproblemtobesol

5、ved.Dataminingisaveryimportantbranchofinformationtechnologydevelopment.Clusteringtechnologyindataminingisbornwiththeuseoftheinformationprocessingoflargeamountsofdata.Clusteringisunsupervised,whichismoreinlinewithreality.Inmanycases,weareoftenunabletogetanyprioriinform

6、ationaboutthegivendata.Clusteranalysiswillbefurtherdevelopedforitswidelyapplication.Inthispaper,amulti.objectiveclustermethodbasedonanewspecialcrossoveroperatorandamulti.objectiveclusterensemblemethodisproposed.Theworksofthispaperareconcludedasfollows:1Amulti.objectiv

7、eclustermethodbasedonanewspecialcrossoveroperatorisproposed.Inthismethod,first,anewcrossoveroperatorisapplied.Second,anothernewoperatorisproposed,whichcangetnewpartitionsbysearchingthesubspaceofthedatabyapplyingdifferentalgorithmswhichCangenerategoodsolutions.Intheexp

8、eriments,26geneexpressiondatasetsand5UCIdatasetsaretested.Thenewproposedalgorithmisalsocomparedtoseveralsimilaralgorithms,an

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。