基于网格服务的分布式数据挖掘

基于网格服务的分布式数据挖掘

ID:33799125

大小:1.70 MB

页数:57页

时间:2019-03-01

基于网格服务的分布式数据挖掘_第1页
基于网格服务的分布式数据挖掘_第2页
基于网格服务的分布式数据挖掘_第3页
基于网格服务的分布式数据挖掘_第4页
基于网格服务的分布式数据挖掘_第5页
资源描述:

《基于网格服务的分布式数据挖掘》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西安电子科技大学硕士学位论文基于网格服务的分布式数据挖掘姓名:李文春申请学位级别:硕士专业:计算机应用技术指导教师:方敏20060101摘要分布式数据挖掘的主要目的是为了减少网络通信成本和利用地理上分布的计算资源和存储资源。论文采用网格技术将地理上分布的计算资源合并,并进行分布式数据挖掘,从而实现该目的.论文首先介绍了一些国内外的主要网格项目及商业产品,然后解释了一些网格的基本概念。将网格和传统的分布式技术作以比较。阐述目前流行的网格体系结构,给出了关联规则的基本概念及其相关度量参数的定义。分析当前流行的

2、并行和分布式数据挖掘算法及ODAM算法。提出对ODAM算法的以下三点改进,改进一:在准备生成n项侯选集之前,如果n.1项全局频繁集的个数小于n,N挖掘结束。改进--:在挖掘n项集前,判断n是否大于最大的事务项目数,如果是,则结束挖掘。改进三:在生成侯选集时,各站点分别计算一部分侯选集,然后合并为全局候选项集。使用雷达数据集和connect-4数据集对三点改进进行了验证,实验证明改进是有效的。最后在GT3环境下,详细地论述基于网格服务实现的ODAM改进算法,并采用雷达数据集和connect-4数据集进行实验

3、,验证了网格可以进行计算力合并的思想。关键字:分布式数据挖掘网格ODAM关联规则GT3ABSTRACTThemainpurposeofdistributeddataminingistoreducethecostofnetworkcommunicationandusethecomputingre,cg)Bl-c∞andstorageresourcewhicharegeographicallydistributed.Thisthesisadopts鲥dtechniquetoincorporatethisgeo

4、graphicallydistributedcomputingresourceandexecutethedistributeddatamining,andthenthepurposeisimplemented.First,thisthesisintroducessomemainnativeandforeign鲥dprojeetsandgridcommodity,thenexplainsomebasicconceptofgrid.Next,comparegridwithsometraditionaldist

5、ributedtechniques.Itexpatiateprevailgridarchitecture,andshowthebasicconceptandcorrelativeperformanceparameterdefinitionofassociationrules.AnalyzedistributedassociationrulesminingalgorithmODAMbaseonresearchingcurrentprevailparallelanddistributeddatamininga

6、lgorithm.ThethesisproposesthreeimprovementsofODAMalgorithmwhichshowasfollow.Firstone:itjudgewhetherornotthenumberofn-!g/ohalfrequentitemsetsislessthannbeforegenerating1"1candidateitemsets,ifyesthentheminingisend.Secondone:judgewhetherornotnisbiggerthanthe

7、maxnumberofitemcountinatransaction,ifyesthentheminingisoveEThirdone:everysitecalculatespartcandidateitemsets,andthenunitesthislocalcandidatefromeverysitetomakeaglobalitemsets.TheThesisuseradardatasetandconaect-4datasetdoexperiment,andtheresultsprovethatth

8、ethreeimprovementsareeffective,Finally,thethesisdiscusstheimplementsoftheimprovedODAMalgorithmbaseongridserviceindetailwithGT3,anddoesexperimentbyadoptingradardataandconnect-4dataset,experimentprovedtheideathatgridc

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。