层次的聚类算法的研究与实现.doc

层次的聚类算法的研究与实现.doc

ID:25912064

大小:5.44 MB

页数:45页

时间:2018-11-23

层次的聚类算法的研究与实现.doc_第1页
层次的聚类算法的研究与实现.doc_第2页
层次的聚类算法的研究与实现.doc_第3页
层次的聚类算法的研究与实现.doc_第4页
层次的聚类算法的研究与实现.doc_第5页
资源描述:

《层次的聚类算法的研究与实现.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、独创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。论文题目:作者签名:日期:年月日论文版权使用授权书本人完全了解吉首大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件和磁盘,允许论文被查阅和借阅,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同意吉首大学可以用不同方式在不同媒体上发表

2、、传播学位论文的全部或部分内容。(保密的学位论文在解密后应遵守此协议)论文题目:学生签名:日期:年月日导师签名:日期:年月日41基于层次的聚类算法的研究与实现摘要聚类分析是数据挖掘中的一个重要领域,是数据划分或分组处理的重要手段和方法,聚类分析已经应该于广泛的领域。聚类算法可以分为基于层次的方法、基于划分的方法、基于网格的方法、基于密度的方法和基于模型的方法。层次聚类算法因为算法思想简单,适合于大量数据的聚类,所以是实际应用中聚类分析的支柱。本文重点对层次聚类算法进行了分析和研究,阐述了基于层次聚类的CURE和BIRCH算法,并实现了

3、这两种算法以及给出了它们的聚类结果。CURE算法是利用代表点聚类,它解决了偏好球形和相似大小的问题,可以发现具有任意大小和形状的聚类,而且在处理孤立点上也更加健壮。BIRCH是用聚类中心和半径来代表聚类,具有一定的处理噪音的能力,而且它是一种增量聚类方法,它不要求所有数据一次性读入内存,所以空间复杂度低,但是BIRCH算法无法发现任意形状和大小的聚类。关键词:聚类分析;层次聚类;CURE;BRICH41ResearchandImplementationofthealgorithmbasedonhierarchicalclusterin

4、gSunXili(CollegeofInformationScienceandEngineering,JishouUniversity,Jishou,Hunan416000)Abstract:Clusteringanalysisisanessentialfieldindataminingandalsoimportantmeansandmethodofdataclassificationorgroupingprocessing.Clusteranalysishasplayedanimportantroleinawiderangeofda

5、tapartitioningareas.Clusteringalgorithmscanbedividedintothemethodbasedonhierarchy,themethodsbasedonthepartition,thegrid-basedmethods,thedensity-basedmethodandthemodel-basedmethod.Hierarchicalclusteringalgorithmisamainstayoftheclusteringanalysisinpracticalapplicationfori

6、tssimplealgorithmideas,andsuitableforlargeamountsofdataclustering.Thispaperfocusesonthehierarchicalclusteringalgorithmanalysisandresearch,expoundsCUREandBIRCHalgorithmbasedonhierarchyclusteringalgorithm,andimplementsthetwoalgorithmsandtheirclusteringresultsaregiven.CURE

7、 algorithm is the use of the clustering of the representative point,itsolved the problem of the  preference of spherical and similar size, clusteringcan be found withany size and shape, but alsomorerobustindealingwiththe isolated point.BIRCH is using the clustering cent

8、er and radius todelegateclustering,also with the ability to handling noise,and it is a kind of incremental clu

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。