欢迎来到天天文库
浏览记录
ID:36795628
大小:2.19 MB
页数:60页
时间:2019-05-15
《基于密度的海量数据增量式挖掘技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、国防科学技术人’掌研究生院学似沦文摘要增量式挖掘,就是对于大数据集(数据库或数据仓库等),当数据递增的时候,增量地更新数据挖掘结果,而不是对每次更新后的整个数据集进行挖掘。对r许多种类的大型数据库或数据仓库挖掘,增量数掘挖掘是一个诱人的目标。t水文主要研究了媾]i孤立点闪于的增量式挖掘技术。首先讲述了数据挖掘的基本概念和方法,介绍了数据挖掘蜘f究的·般对象和典型心用:研究了聚类挖掘技术,晚明了评价聚类的一般准则,简单介绍了现有的典型的增量挖掘力-法,为进一步研究和学习积累了经验,明确了需求。在现有的大多数聚类挖掘方法中,参数的影响较大,而儿常常需要用户指定参数,参数的决定成为实
2、际应用的一个难点。本文在研究基于密度的聚类算法的基础L,提出了基于孤立点因子的聚类算法,有效地解决了这个问题:并在此基础卜,提出了增量式算法,用于增量的更新聚类结果。文中同时给出了孤立点因子聚类疗法的有关概念,以及相应的算法描述,详细说明了算法思想和聚类过程。最后,实验分析了基于孤立点因子的聚类算法的有效性,并与有关算法作了性能对比,实验说明了基于孤立点因子的聚类算法对于参数的健壮性;实验也简要分析了增量式算法的有效性和效率。关键词:数据挖掘聚类分析孤立点因子增量更新国防科学技术大学研究生院学位论文舢孓sTRACTIncrementaldataminingisupdatingt
3、heresultofdataminingincremental1y,whendataincreaseinthelargedataset(suchasdatabaseordatahouse),itisnotupdatingthetotaldataset.Formanykindoflargedatabasesordatahouse,incrementaldataminingisatemptablegoal.Westudytheincrementaldataminingtechnologybasedoutlierfactor.Wefirstdescribethebasicconcep
4、tsandbasicmethodandintroducethecommonlYobjectsandrepresentativeapplications:andwestudyclusteringdataminingtechnologyanddescribethecommonlyrules,andweintroducetheincrementaldatamjningmethod:soweaccumulateexperienceforfartherstudyanddefinituderequirement.Theinfluenceofthealgorithmparametersisv
5、erynotabilityandtheparametersneedtheappointofusersinmassclusteringdataminingalgorithm,sodeterminingparametersisverydifficulty.WebringforwardclusteringalgorithmbasedOUtlierfactot,andresolvetheproblemefficiency,andwegainedtheincrementalalgorithmonthebase.Wedescribetheconceptsofclusteringalgori
6、thmbasedoutiierfactor,andexplaintheideaofthealgorithmandtheclusterjngprocess.Intheend,weanalysisthevalidityofthealgorithm,andwecontrastthealgorithmwiththeether:wearialysisandvalidatethattheparametershave1ittlerjnfluencetoclusteringdataminingalgorithmbasedoutlierfactor:andwealsoanalysisandval
7、idatetheincrementalclusteringdataminingalgoritbm.KeyWords:datamining.cIustering,outIierfactor.incrementaIupdating~~———————万而r——————————~一独创性声明S13712本人声明所呈交的学位论文是我本人在导师指导下进行的研究工作及取得的研究成果.尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或
此文档下载收益归作者所有