基于改进遗传算法的多维关联规则挖掘方法及应用

基于改进遗传算法的多维关联规则挖掘方法及应用

ID:21006686

大小:119.75 KB

页数:5页

时间:2018-10-18

基于改进遗传算法的多维关联规则挖掘方法及应用_第1页
基于改进遗传算法的多维关联规则挖掘方法及应用_第2页
基于改进遗传算法的多维关联规则挖掘方法及应用_第3页
基于改进遗传算法的多维关联规则挖掘方法及应用_第4页
基于改进遗传算法的多维关联规则挖掘方法及应用_第5页
资源描述:

《基于改进遗传算法的多维关联规则挖掘方法及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于改进遗传算法的多维关联规则挖掘方法及应用王仲君,程涤斌汉理工大学理学院,武汉430063)摘要:对遗传算法进行改进,并应用于多维关联规则挖掘屮.在该算法屮提出了一种基于免疫机制的新选择策略,并引入随机数,采川&适应方法随机动态选取交叉和变异概率.这种新算法不仅有效地抑制了早熟收敛现象,而且大大提高了搜索效率.关键词:数据挖掘;多维关联规则;遗传算法中图法分类号:TP301.6文献标识码:A文章编号:1671-0924(2009)04-()055-05MethodandApplicationofMiihgAss

2、oebtionRulesBasedonImprovedGeneticAlgorithmWANGZhong2jun,CH例GDi(DeptofStatistics,SchoolofScience,WuhanUniversityofTechnology,Wuhan430063,China)Abstract:ThispaperinpiovesgeneticalgorithmandappliesitinmultiHinensbnalassociationruleminingAnewselectionstrategybas

3、edonimmunemechanianisproposed,randomnimberhintroduced,andauk)2idaptedmethoddynamicallyandstochasticallyselectingciosjdverpiobabilit>andmutationpiobabilityareusedThenewalgorithmnotonlyrestrainsprematureconvergenceeffectively,butalsoraisesthesearchefficiencygre

4、atlyKeywords:datamining;multi2dinensbnassociationrule;geneticalgorithmAgrawal等人于1993年首先提出了挖掘顾客交易数据库中项集间的关联规则问题,以后众多学者又对此进行了大量的研宄,引入了随机采枵和并行思想,优化了原有的算法,提高了挖掘算袪的效率,促进了关联规则的广泛应用.遗传算法是一种基于群体的进化算法,具有很强的随机性、鲁棒性和隐含并行性,能快速、有效地进行全局优化搜索,是处理大规模数据项FI集的有效方法.本文中详细讨论了遗传算法在关

5、联规则提®方面的应用,针对事务型数据库的特点,提山了偎用实数数组的编码方法,并在此基础上,讨论了足应度函数的构造,然后,通过引入免疫机制,对选3收稿日期:2009-01-25基金项目:国家科学技术协会重点研究课题(2007DCTI08)作者简介:王仲君(19M—),女,博士,教授,主耍从事数据挖掘、智能优化算法、兑杂性科学、计算机真等方面研究.例给出了新算法的具体实现过程,不仅验证了新算法的有效性和可行性,而且对数据挖掘技术在科研领域的应用进行了初步的尝试.1相关概念1.1关联规则关联规则挖掘是数据挖掘中一个很重

6、要的砑究课题,其目的是从人S数裾中提取项集之间的关联和相互关系,广泛应用于决策支持、医疗该断、市场策略、销售分析等许多领域.令/=Zi,4,是事务中全体项目组成的集合,而T={t、,k,d是所有事务的集合.每个事务4包含的项集都是/的子集.在关联分析中,包含0个或多个项的集合被称为项集.关联规W!是形如A]B的蕴含式,其中A<1,B

7、持度大于等于并且置信度大于等于的所有规则,其中和&in是对应的支持度和置信度阈值.1.2遗传算法遗传算法是一种基于生物自然选择与遗传机理的随机搜索方法,它以种群的所有个体为操竹对象,并利用随机化技术对一个被编码的参数空间进行高效搜索.遗传算法从一组随机产生的称为种群的初姅解开始搜索,种群中每个个体对应问题的一个可行解,称为染色体.在每一代中用适应度來衡量深色体的优劣.并选择或淘汰部分后代.这样,经id若干代之后,算法收敛于S好的染色体,它很可能就是M题的最优解或次优解.这样庞大的数据集,无法用简单的0测方法找出其

8、规律,需要进行大:W:的数据挖掘.针对多维关联规则挖掘的特点,本研宄中构造了求解该问题白<,遗传算法.21编码方法的确定用遗传算法进行关联规则挖掘怎样编码是要解决的首要W题.本研究屮采川实数数组的编码方法.实数数组的元素个数与数据库中的字段白1个数相对应,实数数组的元素值则表字段的属性值康示属性1M/2康示属性2,M/7V威示属性M经此操作后,对个体的交叉、变异等操作就变

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。