正、负关联规则挖掘算法的研究与实践

正、负关联规则挖掘算法的研究与实践

ID:33766788

大小:737.05 KB

页数:70页

时间:2019-03-01

正、负关联规则挖掘算法的研究与实践_第1页
正、负关联规则挖掘算法的研究与实践_第2页
正、负关联规则挖掘算法的研究与实践_第3页
正、负关联规则挖掘算法的研究与实践_第4页
正、负关联规则挖掘算法的研究与实践_第5页
资源描述:

《正、负关联规则挖掘算法的研究与实践》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要分类号密级UDC编号桂林电子科技大学硕士学位论文题目正、负关联规则挖掘算法的研究与实践(英文)ResearchandPracticeofDataMingAlgorithmsBasedonPositiveandNegativeAssociationRules研究生姓名:___________刘巍________________指导教师姓名、职务:_______蒋华______副教授_________申请学位门类:工学硕士学科、专业:计算机应用技术提交论文日期:2007年4月论文答辩日期:____

2、_____2007年6月_____________2007年6月14日1万方数据摘要摘要数据挖掘(DataMining)就是从大量数据中提取或“挖掘”知识。数据挖掘被信息产业界认为是信息系统最重要的研究和应用领域之一,也是信息产业界最有前途的交叉性学科之一。关联规则(AssociationRule)是数据挖掘中一个重要的研究内容,而正、负关联规则挖掘(PositiveandNegativeAssociateRulealgorithm)作为关联规则挖掘的一个新的研究课题,用于发现在交易中出现的数据项

3、与未出现的数据项间的关联规则,正逐步受到人们的重视。本文在总结和分析其他关联规则挖掘算法特别是经典的Apriori算法的基础上,根据Apriori算法的缺点设计了编码算法和正、负关联规则挖掘算法。编码算法只要遍历一次数据库,对每个交易中数据项是否出现的情况进行编码,然后通过对编码的逻辑运算来得到最后的关联规则。编码算法沿袭了Apriori算法的频繁项集递推的原理,所以结果是准确可靠的,同时由于所有的频繁相集都是用编码的形式表示,递推过程也是通过不同编码间的逻辑运算来实现,以此减少了遍历数据库的次数

4、,达到提高数据挖掘效率的目的。正、负关联规则挖掘算法的原理是根据概率论中相关系数的概念,设计出兴趣度,用兴趣度阈值来区分规则的前件跟后件之间是无关还是正关联或是负关联,再通过与支持度阈值的比较来得到最后的正或负关联规则。正、负关联规则挖掘算法是通过融合概率论中相关系数的知识,Apriori算法的频繁项集递推的思想和编码算法只需要一次遍历数据库的做法提出的。其中相关系数知识的引入导致了兴趣度的出现使算法可以区分规则是否相关以及规则的正负;频繁项集递推思想的引入确保了挖掘结果的完整性和准确性;编码算法

5、的一次遍历数据库,对项编码的做法提高了相对于正关联规则挖掘开销更大,速度更慢的正、负关联规则挖掘的效率。实验证明,编码算法在数据库查询时间大于编码生成时间的挖掘集合中有很好的提高挖掘效率的作用;正、负关联规则挖掘算法在保证得到正关联规则的同时可以挖掘出更多有意义的负关联规则,其中很多负关联规则是很重要但由于隐藏在正关联规则下而被人们忽视的规则。本文提出的正、负关联规则挖掘算法是本文的重点。关键词数据挖掘;关联规则;Apriori算法;编码算法;正、负关联规则挖掘算法2万方数据AbstractAbs

6、tractDataMiningmeanstomineknowledgefromalargenumberofdata.It’sconsideredasnotonlyoneofthemostimportantresearchandapplicationareasofInformationSystem,butalsooneofthemostpromisingoverlappingdisciplinesintheinformationindustrialfield.PositiveandNegativeA

7、ssociateRulealgorithm,anewresearchtopicofAssociationRulealgorithmwhichisanimportantstudycontentinDataMining,isusedtofindtheassociationrulebetweentheappeareddataitemsandtheonesthathasn’tappearedintransaction.Andnow,peoplehavepaidmoreattentiontoitgradua

8、lly.Thispaper,whichisbasedonthesummaryandanalysisofotherAssociateRulealgorithmsespeciallyclassicalApriorialgorithm,devisesCodealgorithmandPositiveandNegativeAssociateRulealgorithmaccordingtothedefectofApriorialgorithm.Codealgorithmtraversesthe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。