基于密度的海量数据增量式挖掘技术研究

基于密度的海量数据增量式挖掘技术研究

ID:36795628

大小:2.19 MB

页数:60页

时间:2019-05-15

基于密度的海量数据增量式挖掘技术研究_第1页
基于密度的海量数据增量式挖掘技术研究_第2页
基于密度的海量数据增量式挖掘技术研究_第3页
基于密度的海量数据增量式挖掘技术研究_第4页
基于密度的海量数据增量式挖掘技术研究_第5页
资源描述:

《基于密度的海量数据增量式挖掘技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、国防科学技术人’掌研究生院学似沦文摘要增量式挖掘,就是对于大数据集(数据库或数据仓库等),当数据递增的时候,增量地更新数据挖掘结果,而不是对每次更新后的整个数据集进行挖掘。对r许多种类的大型数据库或数据仓库挖掘,增量数掘挖掘是一个诱人的目标。t水文主要研究了媾]i孤立点闪于的增量式挖掘技术。首先讲述了数据挖掘的基本概念和方法,介绍了数据挖掘蜘f究的·般对象和典型心用:研究了聚类挖掘技术,晚明了评价聚类的一般准则,简单介绍了现有的典型的增量挖掘力-法,为进一步研究和学习积累了经验,明确了需求。在现有的大多数聚类挖掘方法中,参数的影响较大,而儿常常需要用户指定参数,参数的决定成为实

2、际应用的一个难点。本文在研究基于密度的聚类算法的基础L,提出了基于孤立点因子的聚类算法,有效地解决了这个问题:并在此基础卜,提出了增量式算法,用于增量的更新聚类结果。文中同时给出了孤立点因子聚类疗法的有关概念,以及相应的算法描述,详细说明了算法思想和聚类过程。最后,实验分析了基于孤立点因子的聚类算法的有效性,并与有关算法作了性能对比,实验说明了基于孤立点因子的聚类算法对于参数的健壮性;实验也简要分析了增量式算法的有效性和效率。关键词:数据挖掘聚类分析孤立点因子增量更新国防科学技术大学研究生院学位论文舢孓sTRACTIncrementaldataminingisupdatingt

3、heresultofdataminingincremental1y,whendataincreaseinthelargedataset(suchasdatabaseordatahouse),itisnotupdatingthetotaldataset.Formanykindoflargedatabasesordatahouse,incrementaldataminingisatemptablegoal.Westudytheincrementaldataminingtechnologybasedoutlierfactor.Wefirstdescribethebasicconcep

4、tsandbasicmethodandintroducethecommonlYobjectsandrepresentativeapplications:andwestudyclusteringdataminingtechnologyanddescribethecommonlyrules,andweintroducetheincrementaldatamjningmethod:soweaccumulateexperienceforfartherstudyanddefinituderequirement.Theinfluenceofthealgorithmparametersisv

5、erynotabilityandtheparametersneedtheappointofusersinmassclusteringdataminingalgorithm,sodeterminingparametersisverydifficulty.WebringforwardclusteringalgorithmbasedOUtlierfactot,andresolvetheproblemefficiency,andwegainedtheincrementalalgorithmonthebase.Wedescribetheconceptsofclusteringalgori

6、thmbasedoutiierfactor,andexplaintheideaofthealgorithmandtheclusterjngprocess.Intheend,weanalysisthevalidityofthealgorithm,andwecontrastthealgorithmwiththeether:wearialysisandvalidatethattheparametershave1ittlerjnfluencetoclusteringdataminingalgorithmbasedoutlierfactor:andwealsoanalysisandval

7、idatetheincrementalclusteringdataminingalgoritbm.KeyWords:datamining.cIustering,outIierfactor.incrementaIupdating~~———————万而r——————————~一独创性声明S13712本人声明所呈交的学位论文是我本人在导师指导下进行的研究工作及取得的研究成果.尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。