聚类分析中K-means算法的改进研究

聚类分析中K-means算法的改进研究

ID:39268402

大小:1.19 MB

页数:38页

时间:2019-06-29

聚类分析中K-means算法的改进研究 _第1页
聚类分析中K-means算法的改进研究 _第2页
聚类分析中K-means算法的改进研究 _第3页
聚类分析中K-means算法的改进研究 _第4页
聚类分析中K-means算法的改进研究 _第5页
资源描述:

《聚类分析中K-means算法的改进研究 》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、青岛理工大学本科毕业设计(论文)摘要大数据时代的到来使得数据挖掘这一新兴的技术开始在许多领域展现出它的魅力,数据挖掘技术涵盖了众多学科知识的同时,分化出了多个研究方向,聚类分析作为其中的一个热门研究方向,受到了许多学者的关注。K-means算法在聚类分析中作为基于划分的典型算法,因为其具有的易于实现、性能好、使用范围广及可伸缩等特点,可以处理多种数据类型的数据集,可是,K-means算法也保留着对最初聚类中心的确定敏感且不易聚类到正确划分的缺点。本文通过K-means算法的这一缺点着重从以下两方面阐述了改进方案:(1)基于改进粒子群优化(PSO)算法的K-mean

2、s算法,PSO算法的特点是具有随机性和并行性,对全局最优解具有较好的查找性能,与K-means算法相比对局部最优解有一定的区分能力,但算法也存在着在搜索空间中对接搜索的随机性和对最优解空间搜索缺乏针对性的缺点。所以首先考虑改进POS算法,通过赋予粒子最优位置和粒子群整体的最优位置的更新公式以一定的权重加快收敛速度与收敛质量,然后通过实验找到最优的权重值,最后在K-means算法中将调整后的PSO算法的更新策略运用于更新簇的形心。通过4组UCI数据集的数值实验对调整后的算法的性能做了测试。(2)基于改进人工蜂群算法的K-means算法,效率高、全局查找能力强、不确定

3、因素少等是人工蜂群算法具有的优点,为了更好的与K-means算法结合,对原人工蜂群算法做了适当的调整。首先对算法的初始化策略进行调整,然后对非线性选择策略及邻域搜索范围调整策略进行了改进,降低算法的随机性以及调高算法的动态性。调整的新方案交替使用两种算法以期达到理想的聚类划分。最后经由一组自构造数据集以及两组UCI数据集来评价算法的有效性。关键词:聚类,K-means算法,PSO算法,人工蜂群算法I青岛理工大学本科毕业设计(论文)AbstractThecomingofthebigdatatimemakesdata-mining,theemergingtechniq

4、ue,beginstoshowitscharminmanyfields.Thedata-miningtechniqueembodiesmanysubjectsknowledge;meanwhile,itappearsmanyresearchdirections.Clusteranalysisisoneofthehotresearchdirections,whichattractstheattentionofmanyscholars.TheK-meansalgorithmistheclassiconeinclusteranalysisbasedondivision,

5、andcansolvevarietiesofdatasetsbecauseithasthefeaturesofeasy-to-implement,highly-effective,well-adaptedandscalability.Butthealgorithmalsohasshortcomingsforexampleitissensitivetotheselectionofinitialclustercenter,andiseasytoconvergetolocaloptimalsolution.Thearticleisbasedonthedeficiency

6、ofK-meansalgorithmtoimproveitfromthefollowingtwoaspects.(1)ComparedwithK-meansalgorithm,POSalgorithmpossessesthefeaturesofrandomnessandparallelization,andhasgoodsearchabilitytoglobalbestsolution.ItisnoteasyforPSOalgorithmtobeinlocaloptimalsolution,butitalsohastheshortcomings,whichisra

7、ndomtodockingsearchinsearchspaceandlackspertinencetothespacesearchofthebestsolution.Therefore,byendowingparticleandthewholepartialswarmwithupdatingformulaofthebestposition,itisbettertogiveprioritytoimprovingPSOalgorithmandacceleratingconvergencespeedandqualityinparticularweight.Then,f

8、indth

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。