基于云计算网格化均值聚类算法并行化的研究

基于云计算网格化均值聚类算法并行化的研究

ID:20875016

大小:7.08 MB

页数:48页

时间:2018-10-17

基于云计算网格化均值聚类算法并行化的研究_第1页
基于云计算网格化均值聚类算法并行化的研究_第2页
基于云计算网格化均值聚类算法并行化的研究_第3页
基于云计算网格化均值聚类算法并行化的研究_第4页
基于云计算网格化均值聚类算法并行化的研究_第5页
资源描述:

《基于云计算网格化均值聚类算法并行化的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、合肥工业大学IIIIIIIIIlUJIIIIIIIMIIIIUlY2315639本论文经答辩委员会全体委员审查,确认符合合肥工业大学硕士学位论文质量要求。答辩委员会签名:(工作单位、职称)主席:叫弩毒更认引鼍驭彼委贝IZl:锄堋翎2/2,步咎云J切短导师:胡伺、忡2炊瀚)掰乏?L/彳面f力证言R巴≥也八善南1泌爻独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标志和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得金魍王些太

2、堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签字:签字日期:硼3年相刀月学位论文版权使用授权书本学位论文作者完全了解金胆王些太堂有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅或借阅。本人授权金鲤王些太堂可以将学位论文的全部或部分论文内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文者签名:签字

3、日期:z/叼;年辱月刀.日学位论文工作单位通讯地址忏导师签名:豕么乙生签字日期:卫形年驷可日电话:l磁秘甲7矿邮编:矿9/基于云计算的网格化均值聚类算法的并行化研究摘要随着互联网和信息通讯技术的飞速发展,网络数据正以指数级的速度增长。面对如此海量的网络数据,如何快速有效地从中提取出潜在的有价值的信息以用于辅助决策,给传统的数据挖掘技术带来了巨大的挑战。最近几年迅速兴起的云计算,因其低廉的运行成本和超强的并行化数据处理能力,正受到越来越多的国内外研究学者的关注,也成为海量数据挖掘技术研究的热点。传统的数据挖掘算

4、法在处理这些高维的、增量式的数据集时,虽然具有良好的效果,但其串行的计算方法的时间复杂度比较高,处理效率也较为低下。本文将传统的数据挖掘算法部署到云计算的环境中,实现传统数据挖掘算法的优点和云计算的优点的融合,从而提高高维、增量式数据集的数据挖掘效率。其中,主要对网格化均值聚类算法在云计算平台Hadoop下并行化的关键技术进行了研究。本文首先描述了云计算相关理论、核心技术以及云计算平台Hadoop,接着描述了数据挖掘的相关理论、技术,着重介绍了其中的聚类分析技术和基于网格的聚类分析技术,然后对基于网格的均值聚

5、类算法进行了改进,并将其应用到云计算平台Hadoop,以实现其并行化,最后模拟了云计算平台ltadoop集群环境,通过实验对改进的网格化均值聚类算法的并行化过程进行验证、分析,并提出了下一步的研究方向和需要改进的地方。关键词:云计算;lladoop;网格化;均值聚类算法;K-MeansTheParaHelizationResearchofGridMeansClusteringAlgorithmBasedonCloudComputingABSTRACTWiththerapiddevelopmentoftheIn

6、ternetandlnformationcommunicationtechnology,thenetworkdataisgrowingexponentially.Howtoquicklyandefficientlyextractpotentiallyvaluableinformationfromsuchamassivenetworkdatafordecision—makinghasbroughtgreatchallengestothetraditionaldataminingtechniques.rapidr

7、iseofCloudComputinginrecentyears,becauseofitslowoperatingcostsandsuperiorparalleldataprocessingcapabilities,hasbeengettingmoreandmoreattentionfromthedomesticandforeignresearchersandscholars.Andithasalsobecomeacentralissueintheresearchofmassivedataminingtech

8、niques.Althoughthetraditionaldataminingalgorithmsindealingwiththesehigh—dimensionalandincrementaldatasets,havegoodresults,thetimecomplexityoftheserialcalculatingmethodisrelativelyhighandtheprocessingef

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。