基于mpi层次聚类算法的研究的研究及实现的论文

基于mpi层次聚类算法的研究的研究及实现的论文

ID:32836420

大小:4.61 MB

页数:67页

时间:2019-02-16

基于mpi层次聚类算法的研究的研究及实现的论文_第1页
基于mpi层次聚类算法的研究的研究及实现的论文_第2页
基于mpi层次聚类算法的研究的研究及实现的论文_第3页
基于mpi层次聚类算法的研究的研究及实现的论文_第4页
基于mpi层次聚类算法的研究的研究及实现的论文_第5页
资源描述:

《基于mpi层次聚类算法的研究的研究及实现的论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、ClassifiedIndex:TP301DissertationfortheMasterDegreeinEngineeringCandidate:Supervisor:LiXinxinZhangHongAcademicDegreeAppfiedfor:MasterofEngineeringSpeciality:DateofOralExamination:University:ComputerSoftwareandTheoryMarch,20tIHarbinUniversityofScienceandTechnology国内图书分类号:TP301工学硕士

2、学位论文基于MPI的层次聚类算法的研究及实现硕士研究生:导师:申请学位级别:学科、专业:所在单位:答辩日期:授予学位单位:李欣欣张宏工学硕士计算机软件与理论计算机科学与技术学院2012年3月哈尔滨理工大学Classified/ndex:TP30lDissertationfortheMasterDegreeinEngineeringResearchandImplementationofHierarchicalClusteringAlogithmBasedonMPICandidate:Supervisor:AcademicDegreeAppHedfor:Sp

3、ecialty:DateofOralExamination:University:LiXinxinZhangHongMasterofEngineeringComputerSottwareandTheoryMarch,2012HarbinUniversityofScienceandTechnology哈尔滨理工大学硕士学位论文原创性声明本人郑重声明:此处所提交的硕士学位论文《基于MP]的层次聚类算法研究及实现》,是本人在导师指导下,在哈尔滨理工大学攻读硕士学位期间独立进行研究工作所取得的成果。据本人所知,论文中除已注明部分外不包含他人已发表或撰写过的研究成

4、果。对本文研究工作做出贡献的个人和集体,均已在文中以明确方式注明。本声明的法律结果将完全由本人承担。作者签名:杏铆期:州埠碉lr日哈尔滨理工大学硕士学位论文使用授权书《基于MPI的层次聚类算法研究及实现》系本人在哈尔滨理工大学攻读硕士学位期间在导师指导下完成的硕士学位论文。本论文的研究成果归哈尔滨理工大学所有,本论文的研究内容不得以其它单位的名义发表。本人完全了解哈尔滨理工大学关于保存、使用学位论文的规定,同意学校保留并向有关部门提交论文和电子版本,允许论文被套阅和借阅。本人授权哈尔滨理工大学可以采用影印、缩印或其他复制手段保存论文,可j以公布论文的全部

5、或部分内容。本学位论文属于保密口在年解密后适用授权书。不保密目。(请在以上相应方框ia打√)作者签名:座旅伏日期:2。阵狷阳聊繇碟恢吼纱阵加晴基于MPI的层次聚类算法的研究及实现摘要数据挖掘领域涉及很多方面的知识,聚类分析是该领域中的技术之~,也是该领域中重点研究内容之一。聚类分析实际上是对数据集进行分类、分组的一种方法。聚类分析应用广泛,在机器学习、生物学、统计学、市场营销等等很多领域都被用到,在这些领域中聚类分析起到了至关重要的作用,做出了不小的贡献。聚类算法是聚类分析中起着决定性作用的部分,聚类分析的中的聚类算法有很多,其中层次聚类算法是主要算法之

6、一。层次聚类算法的特点是结构简单、运行时速度快,并且在遇到大规模数据集的时候,它能够对其进行有效的处理。该算法是实际应用中聚类分析的支柱。层次聚类算法在运行时,会对所有待聚类数据进行距离计算,得到距离矩阵,然后按照矩阵中元素的值对类进行合并操作,产生新的类,但是每一次合并操作之后,要再次对需所有类进行类间距离的计算,这样的操作使得计算的时间复杂度很高。随着数据规模的不断递增,提高聚类效率和聚类质量也是一个刻不容缓的研究方向。基于上述分析,针对层次聚类算法存在的问题,本文对传统层次聚类算法进行了改进,通过把类之间的距离按照一定顺序进行排序,以此来解决合并类

7、后还要重新计算距离的问题,在此基础上本文又结合了最小生成树的算法,即克鲁斯卡尔算法对层次聚类算法做了进一步改进,总体上使得算法可伸缩性得到提高,计算复杂性得到降低。为进一步提高算法执行效率,论文同时研究了并行层次聚类算法的并行实现。选用局域网环境,并行虚拟机PVM和LINUX,共同搭建的机群系统作为并行计算平台。在并行程序的模型上采用了基于MPI消息传递接口的模型。论文在时间复杂度问题上,进行了理论分析,并且进行了实验,从这两个方面对并行算法进行了评价。实验结果表明:基于MPI的层次聚类算法的聚类结果与串行算法相同,但执行效率得到了很大的提高。关键词聚类

8、分析;层次聚类;排序;并行算法;MPI哈尔滨理工大学工学硕士学位论文Resear

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。