关联规则挖掘算法研究 (1)

关联规则挖掘算法研究 (1)

ID:33504486

大小:1.33 MB

页数:49页

时间:2019-02-26

关联规则挖掘算法研究 (1)_第1页
关联规则挖掘算法研究 (1)_第2页
关联规则挖掘算法研究 (1)_第3页
关联规则挖掘算法研究 (1)_第4页
关联规则挖掘算法研究 (1)_第5页
资源描述:

《关联规则挖掘算法研究 (1)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西南交通大学硕士学位论文关联规则挖掘算法研究姓名:陈凯申请学位级别:硕士专业:通信与信息系统指导教师:冯全源20050501西南交通大学硕士研究生学位论文第1页摘要数据挖掘就是从海量数据中提取知识,因此又被称为数据库中的知识发现,它是一个跨学科的新兴研究领域。关联规则分析是其中的一个重要分支,用'丁二发现存在于数据库中的项或属性间的有趣联系,这些联系是事先未知且隐藏的,即不能通过传统的数据库逻辑操作或统计的方法得出。因此关联规则挖掘不是基于数据自身的固有属性,而是基于数据项的同时出现特征。本文首先介绍了数据挖掘的基本概念、存在问题及发展方向。其次介绍了关联分析的基本概念、分类及一些

2、常见的算法思想,其中着重讨论了关联规则算法。关联规则描述了给定数据集中项与项间的有趣联系。目前对海量数据集关联规则的研究主要集中在生成频繁闭项集的挖掘算法上。经典的频繁闭项集挖掘算法CLOSET+根据不同的数据集结构特征,选择自下而上投影FP—tree策略或自上而下伪投影FP.tree策略生成候选频繁闭项集,然后再检测候选项集,筛选出频繁闭项集,计算的成本较高。本文提出了一种基于栈结构的FP.tree挖掘算法S—growth,其仅需构造一棵全局FP.tree,此后利用压栈与出栈过程实现对FP—tree的挖掘,挖掘过程中无需构造条件FP.tree,也不需引入递归策略遍历FP—tree

3、,而且在挖掘过程中可以直接得到完备且非冗余的频繁闭项集。关键词:数据挖掘:关联规则;频繁项集;频繁闭项集;栈西南交通大学硕士研究生学位论文第1I页AbstractDataMiningdistillsknowledgefromamassofdata.So.itiSalsocalledKnowledgeDiscoverfromDatabase.Itisanewresearchareainvolvingseveralbranchsoflearningandcontainingmanydomains.Associationruleisoneofthemostimportantdomains

4、amongthem,whichfindstheinterestingrelationsbetweeniternsorattributesofdatabase.Theserelationsareunknownandhide,i.e.itcannotbegottenwithlogicoperationsorstatisticmethodsoftraditionaldatabaseoperationtechniques.So,miningassociationruledonotbaseonself-attributesbutonco—appearancecharacteramongite

5、msofdatabase.Atthebeginthispaperfirstlyintroducessomebasicprincipaltheories,directionsofdevelopmentandproblemsinthefaceof.Andthen,thispaperpresentstheconceptions,classesandgeneralthoughtsofthealgorithmsaboutassociationrule.Amongthose,someassociationrulealgorithmsal'ediscusseddeeply.Theinterest

6、ingrelationsamongitemsofdatasetal'ereleasedbyassociationrule.Currentresearchinterestingintheassociationrulefocusesonthealgorithmaboutminingfrequemcloseditemsets.Basedonthecharacterofdifferentdatasetstructure,theclassicalgorithmaboutminingfrequentcloseditemsetsCLOSET+needtoadoptbottom-upphysica

7、ltree—projectionortop+downpseudotree—projectionstrategytogetcandidatefrequentcloseditemsets,andthenchecksitforobtainingfrequentcloseditemsets.So,thecostishi曲.ThispaperpresentsanovelminingfrequentcloseditemsetsalgorithmS-growthtomineFP-t

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。