基于遗传算法的数据挖掘技术的研究

基于遗传算法的数据挖掘技术的研究

ID:20870897

大小:209.43 KB

页数:7页

时间:2018-10-17

基于遗传算法的数据挖掘技术的研究_第1页
基于遗传算法的数据挖掘技术的研究_第2页
基于遗传算法的数据挖掘技术的研究_第3页
基于遗传算法的数据挖掘技术的研究_第4页
基于遗传算法的数据挖掘技术的研究_第5页
资源描述:

《基于遗传算法的数据挖掘技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于遗传算法的数据挖掘技术的研究施建强,刘晓平(南京工程学院仿真部,江苏南京210013)摘要:文章首先对数据挖掘进行了概述,阐明了什么是数据挖掘,为什么要数据挖掘,如何进行数据挖掘以及数据挖掘的主要过程。接着介绍了数据挖掘中的一个重要算法遗传算法。文章对遗传算法的产生与发展以及主要理论等进行了简要的介绍,提出了基于遗传算法的关联规则的提取方法。文章还结合作者单位的智能型学生管理系统,给出了用遗传算法进行关联规则挖掘的实例,并讨论了遗传算法所面临的问题与挑战。关键词:数据挖掘;遗传算法;关联规则AbstractFirstly,th

2、ispapercommentsdatamining,explainswhatisdatamining,wh)andhowtodoit,themainprocessofdataminingandsoon1Secondly,anmportanmethodgeneticalgorithms(GA)indataminingisintroduced,andtheorigindevebpmcnt,maintheoryand9DonarcbrieflydiscribcdlOnthisbasis,thispaperbringsforwardthe

3、algorithmsbasedonthegeneticalgorithmsofaS9ociatbnruleslAssociatecwiththeStudentAdministratbnSystem5thispapergivesthealgorithmsandpn)granofminingassociationrulebasedongeneticalgorithmslLastly,thispaperpointsou.challengesofdatamining,summarizestheworkofthispaperandthewo

4、rkinthefuturelKeywordsDataMining;GeneticAlgorithms;associationrule收稿曰期:2002-10-10作者简介:施建强(1971_),男,工程师,在职硕士,主要研究方向为数据库系统设计和网络技术;刘晓平(1947-),男,副教授,硕士,主要硏究方向为光纤通信和软硬件工程开发等。《电脑与信息技术>2003年第1期.0.1数据挖掘概述111数据挖掘定义数据挖掘是从大以的数据中抽取出潜右的、不为人知的有用信息、模式和趋势。数掠挖掘的目的是提高市场决策能力和检测异常模式,在过去的

5、经验基础上预言未来趋势等。数据挖掘就是通过分析已经存在于数据库中的数据来解决问题。数据挖掘被定义成发现数据模式的过程,这个过程必须是自动化的或者(通常)是半自动化的。被挖掘出来的规则应该意味着在某些方面有优势,特别是经济方面的优势。更广义的说法是:数据挖掘意式的决策支持过程。112数据挖掘使用的方法现实生活中的很多技术都可以用于数拘挖掘。模式识别、人工智能等领域的技术、尤法经过改进,大都可以应用于数据挖掘。常用的数据挖掘方法有决策树和遗传算法等。(1)决策树方法利用信息论中的信息增益寻找数据库中具有最大信息量的字段,建立决策树的一

6、个结点,再根据字段的不同取值建立树的分支在每个分支子集中重复建树的下层结点和分支的过程,即可建立决策树。(2)遗传算法这是模拟生物进化过程的算法,由三个算子组成:al繁殖(选择)这是一个从旧种群(父本)中选出生命力强的个体,产生新种群(后代)的过程。bl交叉(重组)选择两个不同个体(染色体)的部分(基因)进行交换,形成新个体。cl变异(突变)对某些个体的某些基因进行变异(1变0、0变1)。113数据挖掘処理过程B前人们对整个処理过程并没有给出非常清楚的划分,数据挖掘的一般过程如图1从系统工程和方法学的角度对数据挖掘进行硏究是数据挖

7、掘的一个硏究方向。从工程角度讲,数据挖掘是一个需要经过多次反复的多処理过程,如同软件幵发的宏观硏穷内容是软件工程,数据挖掘的宏观研究内溶是処理过程模型。合理的処理过程模型能裝各个処理阶段有机地结合在一起,指导人们更好地幵发及使用数据挖掘系统。数据挖掘是根据对数据的分析建立对数据的特性以及数据之间关系描述的模式妇程。在这个描述中,数据是一系列事实的集合(例如数据库中的实例),而模式是使用某科语言对数据集合一个子集的描述。过程是右数据挖掘中包含的步骤,如数据的预処理、模式搜索、知识表示以及知识评价等。2遗传算法211遗传算法遗传算法(

8、GeneticAlgorithm,GA)是近几年发展起来的一种崭新的全局优化算法,它借用了生物遗传学的观点,通过自然选择、遗传、变异等作用机制,实现各个体适应性的提高。用遗传算法解决问题时,先要对待解决问题的模型结构和参数进行编码,一般用字符串表示

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。