全局k-均值聚类算法研究与改进

全局k-均值聚类算法研究与改进

ID:33180723

大小:9.82 MB

页数:84页

时间:2019-02-21

全局k-均值聚类算法研究与改进_第1页
全局k-均值聚类算法研究与改进_第2页
全局k-均值聚类算法研究与改进_第3页
全局k-均值聚类算法研究与改进_第4页
全局k-均值聚类算法研究与改进_第5页
资源描述:

《全局k-均值聚类算法研究与改进》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西安电子科技大学学位论文独创性(或创新性)声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切的法律责任。本人签名:盘函关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知

2、识产权单位属西安电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文:学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后结合学位论文研究课题再攥写的文章一律署名单位为西安电子科技大学。本人签名:.盘亟导师签名:—≤良Et期型壁:童:』垒日期j碰时摘要聚类分析是数据挖掘、模式识别和机器学习领域的重要研究内容,其功能是按照某种准则将数据划分成组。目前,对于聚类问题的研究普遍存在于社会生活中的各个领域,如模式识别,图像处理、机器学习和统计学等,作为数据分析和理解的重要方法,聚类分析研究已经有很长的历史。K.均值聚类算法是一种被广泛使用的

3、聚类算法,具有简单易行、高效性等优点。但是该算法存在着一定的缺陷:它对聚类中心初值的选择具有很强的依赖性和敏感性、易受孤立点影响、易陷入局部最优;另一方面,需要事先指定K值表示聚类个数,且K值是决定聚类质量的关键因素之一;另外,在实际应用中将其应用于图像分割时对噪声很敏感。为了改善K.均值算法中所存在的这几个缺陷,本文提出并设计了三种改进算法,主要工作内容如下:1)提出了一种改进的快速全局K.均值聚类算法,该方法在快速全局K一均值的基础上加入了两种改进策略,大大降低了计算量,加快了计算速度。这样不仅解决了K一均值聚类算法最终的聚类结果强烈依赖于初始聚类中心的选取且聚类结果非常不稳定的问题,

4、而且解决了使用快速全局K.均值算法需要计算数据集关联矩阵的问题,用更短的时间得到了更为理想的聚类结果,并且该算法可以用于较大规模数据集的聚类。通过实验证明该算法不仅性能稳定,而且在不影响聚类效果的前提下比原始的快速全局K一均值算法速度更快。2)提出了一种基于新聚类有效性函数的快速全局K均值聚类算法,用一种新的有效性评价函数结合前面提出的改进快速全局K一均值算法,设定在一定范围内变化聚类数,使用聚类算法划分样本数据集,用有效性评价函数评估多次聚类结果的质量,最后找出最优的类别数K值。该算法解决了类别数K值的自动选择问题。实验证明该算法不仅适用于人工数据集和UCI数据集,还可用于自然图像的自动

5、分割,实验结果不仅自动的得到了正确的类别数,而且取得了良好的聚类效果。3)提出了一种结合图像空间信息的快速全局K一均值聚类算法并将其应用于含有噪声的图像的分割,在前面提出的改进的快速全局K一均值聚类算法的基础上结合图像的空间位置信息,加强了该算法用于图像分割时对噪声的鲁棒性。实验证明将该算法用于含有噪声的图像的分割取得了良好的效果,对噪声具有很好的鲁棒性。关键词:数据挖掘聚类分析快速全局K一均值聚类聚类有效性空间信全局K均值聚类算法研究与改进AbstractClusteranalysisisanimportantresearchcontentofdatamining,patternreco

6、gnitionandmachinelearningfieldsanditsfunctionisdividingthedataintogroupsinaccordancewithcertaincriteria.Currently,theclusteringproblemisprevalentinallareasofsociallife,suchaspatternrecognition,imageprocessing,machinelearningandstatistics.Theclusteringproblemofallkindsofdatainsociallifehasbecomeaho

7、tresearchtopic.Asanimportantmethodofdataanalysisandunderstanding:theclusteranalysisstudyhasaverylonghistory.K-meansclusteringalgorithmisawidelyusedclusteringalgorithm,andithastheadvantagesofsimpleandhighefficienc

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。