欢迎来到天天文库
浏览记录
ID:42136439
大小:300.50 KB
页数:17页
时间:2019-09-08
《遗传算法在数据挖掘中的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、学院:—J±M崖院班级:学号:2deeeeeeeeeee姓名:2015年]月遗传算法在数据挖掘中的研究与应用摘要遗传算法(genectialgoritlllnn,GA)是一种模拟牛物进化过程的自适应全局优化算法,是解决现代非线性优化问题的一种重要方法。对于大量数据的嘈朵无序的特征,遗传算法是有效解决此类问题的方法Z-o它模拟口然选择和生物遗传机制,利用遗传算子产生后代,通过群体的迭代,使个体的适应性不断提高,最终群体屮适应值最高的个体即是优化问题的最优或次优解。数据挖掘(DataMining,DM)就是从大量的、不完全的、有噪声的、模糊的、随机的数据屮,捉取隐含在其屮的、人们
2、事先不知道的、但又是潜在有用的信息和知识的过程。它借助了多年來数理统计技术和人工智能以及知识工程等领域的研究成果构建自己的理论体系,是一个交叉学科领域,集成了数据库、人工智能、数理统计、可视化、并行计算等技术。关联规则作为数据挖掘领域的一个重要研究分支,针对关联规则挖掘中经典算法-Aprior算法的局限性,在划分技术的基础上捉出了一种基于遗传算法的关联规则挖掘模型。分类是数据挖掘中最重要的方法之一,决策树作为发现分类模型的常用技术现已被广泛研究并取得了很大的进展。然而,在决策树的构造过程屮采用贪心算法,造成了决策树容易过分拟合、规模过大、产生的规则长度过长等缺点。针对这些缺陷
3、,捉出了一种基于遗传算法与关联规则算法的混合分类挖掘方法。本论文主要围绕着遗传算法应用于数据挖掘研究展开,基木上分为四部分:(1)X'J'KDD(KnowledgeDiscoveryinDatabase)技术进彳亍了总体上的概述,包括KDD的含义、一般过程、主要方法和技术、研究的现状及存在的问题等,为在这一领域进行更为深入的研究打下初步基础。在此基础之上对发现分类模型的各种技术以及关联规则挖掘算法进行了较为全而的研究。(2)对遗传算法的编码方法、适应度函数、遗传操作算了、参数的选择作了全面且深入的研究。(3)对提出的基于遗传算法的关联规则挖掘方法进行了全面的描述。(4)对提出
4、的基于遗传算法与关联规则算法相结合的混合分类方法进行了全而的分析。关键词遗传算法;数据挖掘;分类;关联规则ResearchandApplicationonDataMiningbasedonGeneticAlgorithmAbstractGeneticAlgorithmisakindofglobaloptimizationalgorithmwhichsimulatestheprocessofbiologicalevolution,it'saimportantmethodtosettlemodernnonlinearoptimizationproblems.Forthechaos
5、ofthevestdata,GeneticAlgorithmisoneoftheeffectivemethodsthatcansolvethiskindofquestion.Itsimulatesnaturalselectionandbiologicalgeneticmechanismandgeneratestheoffspringbygeneticoperators.Throughtheiterativenessofpopulation,thefitnessesoftheindividualsisimprovedandfinallytheindividualwiththeh
6、ighestfitnessjustistheoptimalsolutionorsuboptimalsolutionoftheoptimizationproblem.DataMining(DM)isaprocessthatpickpreviouslyunknownandpotentiallyusefulinformationandtechnologyfromlargevolumesofincomplete,fuzzyandstochasticdatawithnoise.Itmadeuseresearchachievementsofmanyyearsintheareasofsta
7、tisticalandmathematicaltechniques,artificialintelligenceandknowledgeengineeringetc.toformitstheorysystem.ItisaCross-DisciplineFieldwhichintegratedthetechnologysuchasdatabase,artificialintelligence,statisticalandmathematicaltechniques,DescriptionandVisual
此文档下载收益归作者所有