基于改进的clique算法的高维数据流聚类研究

基于改进的clique算法的高维数据流聚类研究

ID:33147732

大小:1.05 MB

页数:66页

时间:2019-02-21

基于改进的clique算法的高维数据流聚类研究_第1页
基于改进的clique算法的高维数据流聚类研究_第2页
基于改进的clique算法的高维数据流聚类研究_第3页
基于改进的clique算法的高维数据流聚类研究_第4页
基于改进的clique算法的高维数据流聚类研究_第5页
资源描述:

《基于改进的clique算法的高维数据流聚类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于改进的CLIQUE算法的高维数据流聚类研究ClusteringHigh-DimensionalDataStreamsoverImprovedCLIQUEalgorithm作者姓名唐成龙指导教师邢长征学科专业计算机软件与理论二0一二年十一月论维基于改进的CLIQUE算法的高维数据流聚类研究唐成龙辽宁工程技术大学关于论文使用授权的说明本学位论文作者及指导教师完全了解辽宁工程技术大学有关保留、使用学位论文的规定,同意辽宁工程技术大学保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅,学校可以将学位论文的全部或部分内容编入有关数据库进行检索

2、,可以采用影印、缩印或扫描等复制手段保存、汇编本学位论文。保密的学位论文在解密后应遵守此协议学位论文作者签名:____________导师签名:_____________年月日年月日分类号TP311学校代码10147UDC004.62密级公开硕士学位论文基于改进的CLIQUE算法的高维数据流聚类研究ClusteringHigh-DimensionalDataStreamsover研究ImprovedCLIQUEalgorithm作者姓名唐成龙指导教师邢长征申请学位工学硕士学科专业计算机软件与理论研究方向数据流挖掘辽宁工程技术大学致谢毕业将至,硕士论文已近完成,感谢所有

3、在研究生阶段帮助过我的老师、同学和朋友,在这里对您们说一声谢谢。首先,感谢我的导师邢长征教授。读研期间,邢老师对我的谆谆教诲犹如黑暗夜空中的一盏明灯,指给我正确的前行方向。感谢邢老师在生活上对我的关心,让我虽离家千里仍能体会到家的温馨。感谢老师严谨的治学态度,教会我做学问,论文的完成少不了老师的汗水,老师的教诲让我一生都受益匪浅。感谢工大对我的培养,感谢教导过、没教导过、见过和没见过的所有老师,因为有你们在,才有了工大的今天,才有了我们的未来。感谢实验室的师兄弟姐妹们,在日常生活中的相互照应,在学习中的相互鼓励,让我快乐地度过了研究生的生活。感谢那些未曾谋面的文献工作

4、者,是你们在我撰写论文的过程中帮助我拓展了思维的深度和广度。感谢自己的父母,是你们给予了我物质和精神上的支持,因为有了你们的支持,才有了今天的我。再一次向关心、帮助过我的所有人表达最真挚的感谢!摘要本文在传统的CLIQUE算法上提出了一种改进的CLIQUE算法。该算法采用新的网格划分方法,通过将网格单元边长再细分为两份,避免了CLIQUE算法在生成候选密度单元时可能会丢失潜在的数据点的问题;提出一种处理与稠密单元相邻的稀疏单元内的数据点的方法,能有效提高聚类的精度;使用一种新方法处理同一个簇中的稠密单元不相邻的问题,改善簇的数目不准确的问题;设计了一种自顶向下的簇生成

5、过程来提高算法的效率,避免了CLIQUE算法在高维空间中计算量过大的问题,并且避免MDL剪枝造成的精度丢失。在改进的CLIQUE算法的基础上提出了高维数据流聚类算法HA-Stream。该算法将聚类过程分为在线和离线两个阶段,离线阶段使用改进的CLIQUE算法有效提高算法的效率和聚类的精度。通过实验结果表明,与CLIQUE算法和CluStream算法相比,HA-Stream算法具有更高的聚类精度和更好的可伸缩性,证明了HA-Stream算法是有效可行的。关键词:子空间聚类;CLIQUE;高维空间;数据流;网格单元;微单元-I-AbstractAnimprovedCLIQ

6、UEalgorithmwasproposedbasedontheprimitiveCLIQUEalgorithm.Itadoptedanewgrid-partitioningmethodbysubdividingthesideofanunitintotwo,toavoidlosingthepotentialdatapointsinthegenerationofthecandidatedenseunitsoftheCLIQUE.Itincludedanewmethodforprocessingdatapointsofsparseunitsadjacentdenseuin

7、its,whichcaneffectivelyimprovetheaccuracyofclustering.Usinganewmethodofdealingwiththeproblemthatdenseunitsinthesameclusterwerenotadjacent,thenewalgorithmimprovedtheinaccuratenumberofclusters.Theimprovedalgorithmalsodesignedatop-downclusteringalgorithmtoavoidthelargeamountofcalc

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。