邻域平衡密度聚类算法

邻域平衡密度聚类算法

ID:37844604

大小:593.40 KB

页数:9页

时间:2019-06-01

邻域平衡密度聚类算法_第1页
邻域平衡密度聚类算法_第2页
邻域平衡密度聚类算法_第3页
邻域平衡密度聚类算法_第4页
邻域平衡密度聚类算法_第5页
资源描述:

《邻域平衡密度聚类算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、计算机研究与发展ISSN100021239PCN1121777PTPJournalofComputerResearchandDevelopment47(6):104421052,2010邻域平衡密度聚类算法武佳薇李雄飞孙涛李巍(符号计算与知识工程教育部重点实验室(吉林大学)长春130012)(wjw7251@163.com)ADensity2BasedClusteringAlgorithmConcerningNeighborhoodBalanceWuJiawei,LiXiongfei,SunTao,andLi

2、Wei(KeyLaboratoryofSymbolComputationandKnowledgeEngineering(JilinUniversity),Ministry2of2Education,Changchun130012)AbstractClusteringisanimportantanalyticaltoolindatamining.Density2basedclusteringanalysisisaclusteringanalysismethodwhichisdemandedtodealwithv

3、erylargedatabases.Byanalyzingthelimitationoftheexistingdensity2basedclusteringalgorithmsandtheproblemsofdisposingvariousdensitiesofdataandillegibilityofclustersboundaries,definitionssuchasprojectionpoints,neighborhoodbalance,balanceablecorepoints,andboundar

4、ysparsepointsareintroduced.Afteranalyzingthedistributioncharactersofcorepointsandpointsintheirneighborhood,adensitybasedclusteringalgorithmbDBSCANconcerningtheneighborhoodbalanceofcorepointsisproposedtoimproveDBSCAN.Thealgorithmdealswiththecorepointsbygetti

5、ngtheprojectionofthepointsintheirneighborhoodtojudgewhethertheyarebalanceable.Onlybalanceablecorepointscanbeexpandedtoformclusters.Thealgorithmcandiscoverclusterswitharbitraryshapeandvariousdatadistributioncharacterseffectivelyandefficientlyandeliminatenois

6、esuchasboundarysparsepoints.Thetheoreticalanalysisandexperimentalresultsindicatethatthealgorithmimprovestheaccuracyofclusteringandoffersbetterresultsofclusteringonvariousdatasetsandsolvesthedifficultiesofclusteringhighdimensionalspatialdatasuchasindistinctb

7、oundarybetweenclusters,toomanynoisedatapoints,etc.Meanwhilethechoiceandimpactoftheparameterinthealgorithmarediscussed.Keywordsprojectionpoint;neighborhoodbalance;balanceablecorepoint;boundarysparsepoint;density2basedclusteringalgorithm摘要聚类是数据挖掘领域的一项重要分析手段.在

8、分析核心对象与其邻域对象的分布特征后,引入对象的投影点,对象的邻域平衡、平衡核心对象、边界稀疏对象等概念.提出一种新的基于密度的聚类算法bDBSCAN(balance2DBSCAN).算法将核心对象邻域中的对象投影,进行向量单位化,考察核心对象的邻域平衡性,将与平衡核心对象平衡密度可达的对象聚成一个簇.理论分析和实验结果表明,算法可以处理任意形状的簇,有效地排除边界稀疏对象这类噪声,并且可以解决高维

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。