基于共享近邻亲和度的聚类算法的研究

基于共享近邻亲和度的聚类算法的研究

ID:17833534

大小:3.99 MB

页数:58页

时间:2018-09-07

基于共享近邻亲和度的聚类算法的研究 _第1页
基于共享近邻亲和度的聚类算法的研究 _第2页
基于共享近邻亲和度的聚类算法的研究 _第3页
基于共享近邻亲和度的聚类算法的研究 _第4页
基于共享近邻亲和度的聚类算法的研究 _第5页
资源描述:

《基于共享近邻亲和度的聚类算法的研究 》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码10459学号或申请号201512172140密级硕士学位论文基于共享近邻亲和度的聚类算法的研究作者姓名:辛杭导师姓名:邱保志学科门类:工学专业名称:计算机科学与技术培养院系:信息工程学院完成时间:2018年5月AthesissubmittedtoZhengzhouUniversityforthedegreeofMasterResearchonClusteringAlgorithmBasedonSharedNeighborAffinityByHangXinSupervisor:Prof.BaoZhiQiuComputerScienc

2、eandTechnologySchoolofInformationEngineeringMay2018学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。学位论文作者:日期:年月日学位论文使用授权声明本人在导师指导下完成的论文及相关的职务作品,知识产权归属郑州大学。根据郑州大学有关保留、使用学位论文的规定,同意学校保留或

3、向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权郑州大学可以将本学位论文的全部或部分编入有关数据库进行检索,可以采用影印、缩印或者其他复制手段保存论文和汇编本学位论文。本人离校后发表、使用学位论文或与该学位论文直接相关的学术论文或成果时,第一署名单位仍然为郑州大学。保密论文在解密后应遵守此规定。学位论文作者:日期:年月日摘要数据挖掘是指从大量数据中挖掘出隐含的、未知的并具有较大潜在价值的信息的过程,从不同的角度和层面对数据进行分析处理,并将挖掘出的有用信息和模式应用在生产实践中。聚类分析是数据挖掘的主要任务之一,

4、通过将给定的数据集划分成互不相交的非空子集,从而更好的分析数据的内部结构,发现具有同类特征的模式,同时可以获得数据的分布状况,观察每一个聚类中数据的特征,对特定的簇集作进一步的分析。聚类分析在数据挖掘、模式识别、机器学习、信息处理等诸多领域都具有广泛的应用。本文在研究现有聚类算法的基础上,从密度聚类方法中所需的相似性度量展开研究,分析了现有相似性度量不能准确反映数据分布的问题,提出一种新的相似性度量,并据此提出一种基于共享近邻亲和度的聚类算法。另一方面,本文研究了现有的聚类边界算法,分析了聚类边界的分布特征,在基于矩阵模型进行边界检测算法的

5、基础上,将边界检测算法作为聚类处理的预处理方法,使用提取出的边界信息指导聚类过程。本文的主要创新工作如下:(1)结合k近邻和共享近邻给出了共享近邻亲和度的定义,以该定义为基础提出了一种局部密度度量模型。(2)按照先对核心点进行聚类,后对非核心点进行指派的聚类思想,提出了基于共享近邻亲和度的聚类算法。实验结果表明,该算法能够发现任意形状、大小和密度的聚类,与同类算法相比,该算法在处理多密度数据集和高维数据时具有较高的聚类准确率。(3)提出了使用MMC(基于矩阵模型的高维聚类边界检测技术,Clusteringboundarydetectionb

6、asedonmatrixmodel)提取边界点,然后对核心点和边界点由内而外的形成聚类的思想。(4)提出了一种基于矩阵模型进行边界检测的聚类技术,实验选取了分布特征各不相同的数据集,实验结果表明该算法可以有效的识别出聚类边界并取得较好的聚类结果。关键字:聚类密度共享近邻聚类边界数据挖掘IAbstractDataminingistheprocessofmininghidden,unknownandpotentiallyvaluableinformationfrommassdata.Thecommonmethodsofdatamininginc

7、ludeclassification,regressionanalysis,clustering,extractionofassociationrules,deviationanalysis,Webpageminingandsoon,theyanalyzethedatafromdifferentanglesandapplytheinformationandpatternsexcavatedtotheproductivepractice.Clusteringistheprocessofdividingagivendatasetintononi

8、ntersectedandnonemptysubsets.Byclusteringpeoplecananalyzethestructurewithinthedata,andfin

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。