基于FP树的最大频繁模式挖掘算法研究

基于FP树的最大频繁模式挖掘算法研究

ID:37375699

大小:2.34 MB

页数:75页

时间:2019-05-22

基于FP树的最大频繁模式挖掘算法研究_第1页
基于FP树的最大频繁模式挖掘算法研究_第2页
基于FP树的最大频繁模式挖掘算法研究_第3页
基于FP树的最大频繁模式挖掘算法研究_第4页
基于FP树的最大频繁模式挖掘算法研究_第5页
资源描述:

《基于FP树的最大频繁模式挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、广西大学硕士学位论文基于FP-树的最大频繁模式挖掘算法研究姓名:冯志新申请学位级别:硕士专业:控制理论与控制工程指导教师:钟诚2003.5.1基于FP-树的最大频繁模式挖掘算法研究摘要f从大型数据库中挖掘关联规则是数据挖掘领域中非常重要的研、、究课题。其中,最大频繁模式挖掘问题在关联规则挖掘任务中扮演着重要的角色,具有广泛的应用前景。FP-树是算法FP-growth中提出的新的数据结构。借助于F卜树结构,算法FP—groYrth采用不同于Apriori系列算法的候选产生测试方法而采取模式增长方法挖掘频繁模式,取得了很好效果。、j、,本文主要在以下几个方面对基

2、于FP一树的最大频繁模式挖掘问题进行研究:第一是提出了基于FP-树的最大频繁模式挖掘算法FP-Max。在该算法中,我们首先介绍了FP-树的定义和构造过程,并分析了基于FP-树进行挖掘的可行性和完整性;然后我们提出基于FP-树的最大频繁模式挖掘算法FP—Max。试验表明算法FP-Max在挖掘密集型、频繁模式较长的大数据集时是有效的。第二是提出FP-树驻留磁盘的最大频繁模式挖掘算法FP-Max-Djsk。算法FP_Max运行的前提是构造的FP-树能够驻留内存,但是当事务数据库,船很大或者设置的最小支持度阀值rain_sup很小时,那么构造驻留内存的FP一树将是不

3、现实的。为此,我们首先将原事务数据库TDB划分为一系列投影数据库,然后将每个投影数据库构造为能够装入内存的条件FP一树,最后基于这些条件FP_树挖掘最大频繁模式。第三是研究探讨了基于FP一树的最大频繁模式并行挖掘问题。借助于多局部频繁模式树和并行投影技术,本文提出了两种基于共享内存计算模型的最大频繁模式并行挖掘算法√根据理论分析,这两种并行算法在采用了新的数、、据结构和简单的动态负载平衡技术后,可以实现各处理器独立异步运行、较小的I/0开销以及良好的负载平衡。。关键字数据挖掘关联规则最大频繁模式频繁模式树共享内致并行挖掘IISTUDYONMAXIMALFRE

4、QUENTPATTERNMININGALGoRITHMSBASEDoNFP.TREEABSTRACTDiscoveryofassociationrulesfromlargedatabaseshasbeenconsideredasaveryimportanttaskindataminingarea,andtheproblemofminingmaximalfrequentpatternplaysanimportantroleinmanyassociationrulesminingtasksandhaswideapplicationsFP·treeisanovel

5、datastructurepresentedinalgorithmFP—growthByconstructingFP-tree,algorithmFP—growthcandiscoverfrequentpatternbypattern—growthmethodinsteadofcandidate—generation—testmethodoftheApriorialgorithmsThisthesisstudiesmostlytheproblemofminingmaximalfrequentpatternbasedonFP—tree.Firstly,wepr

6、esentthealgorithmFP.MaxforminingmaximalfrequentpatternbasedonFP.tree.WeintroducethedefinitionandconstructionofFP—treeandanalyzethefeasibilityandcompletenessofFP-tree.Then,weproposethealgorithmforminingmaximalfrequentpatternFP—Max.Atlast,ourexperimentalresultshowsthatthealgorithmFP—

7、Maxisefficientwhenminingthelongfrequentpatternsinlargedensedatasets.Secondly,wepresentanalgorithmFP-Max-Diskforminingmaximalfrequentpatternbasedondisk—basedUlFP—tree.TheproposedFP—Maxisessentiallyamainmemory。basedmaximalfrequentpatternminingmethod.However,whenthetransactiondatabase

8、TDBislarge,orwhentheminimu

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。