基于密度的分布式聚类算法研究

基于密度的分布式聚类算法研究

ID:34112944

大小:1.45 MB

页数:58页

时间:2019-03-03

基于密度的分布式聚类算法研究_第1页
基于密度的分布式聚类算法研究_第2页
基于密度的分布式聚类算法研究_第3页
基于密度的分布式聚类算法研究_第4页
基于密度的分布式聚类算法研究_第5页
资源描述:

《基于密度的分布式聚类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、哈尔滨工程大学硕士学位论文基于密度的分布式聚类算法研究姓名:温海峰申请学位级别:硕士专业:计算机软件与理论指导教师:刘杰20070301哈尔滨工程大学硕士学位论文摘要随着现代企业的信息化快速发展,信息系统产生的数据量日益增大,从大量的数据中提取有用信息并非易事。如何有效地利用海量的原始数据分析现状、预测未来,已成为人类面临的一大挑战,数据挖掘就是为了满足这种需要而产生的。JavaDataMining框架是Java平台下的标准数据挖掘应用程序规范,本文介绍了JDM的三个核心组成部分及三者之间的关系,详细讨论了JDMAPI的部分接口、方法。聚类分析是数据挖掘中的一个重要研究领域,目前聚

2、类在销售、多媒体和生物学等方面的应用越来越广泛。在这些应用领域中,数据都分布在不同的站点上,如果使用传统的聚类算法从这些分布式数据中提取信息,就必须把这些数据合并到一个中心站点上。由于传输速度和安全因素的限制,把各个站点的数据都集中到中心站点上是十分困难的,在某些领域中把数据集中到一个站点几乎是不可能的,额外开销很大。DBDC算法是一种基于密度的分布式聚类算法,本文针对DBDC算法在局部聚类和全局聚类上的不足进行了改进。改进后的算法能够有效地处理局部站点的噪声数据,在不明显降低效率的前提下有效地提高了分布式聚类的准确性。关键词:数据库,分布式数据挖掘,聚类,JavaDataMini

3、ng哈尔滨T程大学硕士学位论文AbstractWith低rapiddevelopmentofmodementerprise.datageneratedfxomdifferentinformationsystemsbecomemoreandmore.ItisreallynoteasytoextractusefulinformationfTomsuchavastamountofseUree8.Howtontilizethehugeorighlaldatatoanalysecurrentsituationandpredictfutureofquantitieseffectively,ha

4、salreadybec沁meagreatchallengethatthehumanbeingshavefaced.DataMiningisdevisedtosolvetheproblem.JavaDataMiningframeworkisastandarddataminingspecificationunderJavaTMplatform.InthisthesisthreeenrecomponentsofJDMandrelationshipsamongthemareexplained.Someinterfacesandmethodsarediscussedindetail.Oust

5、eranalysisisallimportantresearchareaindatamining.Nowadaysclusteringhasbecomeallincreasinglywidetaskinmodernapplicationdomainssuchasmarketingandpurchasingassistance,multimedia,Biologyaswellasmanyothers.Inmostofthesea1-cas.thedataaledistributedaldifferentsites.Inordertoexlractinformationfromthes

6、edistribnteddatawithtraditionalclusteringalgorithm,thedistributeddatahavetobemergedatacentralsiteandthenclustered.Itissuchahardtopic,Menincredibleinsomeapplication,tocollectthesedistributeddataduetotherestrictionoftransmission印髓dand姐fetyfactor.Inthisthesis,DBDCalgorithm,whichisadistributeddata

7、miningalgorithmbasedondensity,isdiscussedindetail.Accordingtoitsdeficiencyinlocalandglobalclustering.anenhanceddistributeddataminingalgorithmbasedondensityisproposed.111ealgorithmmentionedabove啪dealwiththenoisydameffectivelyandimproveth

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。