浅谈数据挖掘算法研究与实现

浅谈数据挖掘算法研究与实现

ID:46754090

大小:67.50 KB

页数:3页

时间:2019-11-27

浅谈数据挖掘算法研究与实现_第1页
浅谈数据挖掘算法研究与实现_第2页
浅谈数据挖掘算法研究与实现_第3页
资源描述:

《浅谈数据挖掘算法研究与实现》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、摘要:该文基于交互式、多层次挖掘、复杂数据类型一一时间序列相似挖掘,集成化挖掘,从数据挖掘平台的构建以及行业应用的也度,对数据挖掘屮的相关算法进行研究,并H在此基础上,探讨了数据挖掘算法在实际应用中应该如何实现。中国论文网关键词:数据挖掘算法;数据仓库;时间序列;实现方式中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)36-8589-02随着计算机信息技术的飞速发展,大容量的存储技术以及条形码等数据获取设备在生活中得到的广泛的应用,我们在生活中也在与不同类型的数据打交道,这些数据背后隐藏着巨大的价值信息,如何深入挖掘数据有效利用数据是当前我们关注的主要问题

2、。数据仓库是血向主题的,集成化的,并且随着时间不短变化的数据集合,通过对不同的数据源进行转化和继承能够对历史数据和现有数据实现数据的综合管理,从而为进一步分析挖掘数据提供基础。笔者在下文中主要首先分析了当前数据挖掘的现状,探讨数据挖掘的基本技术和算法,最终研究基于数据仓库的联机分析挖掘平台的实现。1数据挖掘的现状随着数据库技术以及数据处理的人工智能haunted发展,数据挖掘技术应运而生,数据挖掘技术旨在从大量的隐藏数据中挖掘出切实可用的信息,从而更好地服务与我们H常生产和生活的各个领域。数据挖掘技术具有构筑企业竞争优势的特点,从而为其带來经济效益,因此当前许多知名企业和大型公司也纷

3、纷加大了对数据挖掘的研究和应用。数据挖掘从不同的划分标准可以分为不同的类型,例如根据数据模型來划分;对以将数据挖掘划分为如下儿类:关系的、事务的、面向对象的、对象-关系的等,从特定类型來划分,可以分为空间的、时间序列的。文本的、多媒体的等。复杂的数据挖掘系统一般会采用多种数据挖掘技术相结合,以集成化的数据挖掘系统支持毒品抽象层的知识发现。从应用的角度来划分,数据挖掘系统可以分类特定领域的数据挖掘工具和通用的数据挖掘工具,其屮特定领域的数据挖掘工具主要是指针对某一特定领域的数据挖掘,在设计中针对数据的特殊性做了系统的进一步优化。相比较国外,我国对数据挖掘的研究起步还较晚,但经过长期人量

4、的研究,已经开发出了一系列数据挖掘的工具,虽然还不完美,但总的来说取得了满意的效果。2数据挖掘算法的内容数据挖掘算法是对数据挖掘方法的具体实现,主要包括了以下三个部分主要内容,分别是模型表示、模型评价标准、发现方法。1)模型表示:要提高模型的表达力,模型语言的恰当运用发挥着重要作用。语言的描述强度对模型的精准性产生着重大的影响,当语言表达能力过强的时候,可能会使得模型过分—•般化,其精度也会相对下降,因此合理恰当把握模型表示的语言强度对于保证模型精准性具有重要意义。2)模型评价标准:模型评价标准主耍是指对一个模型的最终发现结杲和具体的要求之间做出量化评价。针对预测类的模型,为了捉高预

5、测的精准度,可以利川测试数据集来进行评价。具体的评价内容可以从模型的精确度、新颖度以及实用价值来进行综合评价。3)发现方法:数据挖掘的发现方法可以分类两类:参量发现、模型发现,发现方法是在完成模型表示和模型评价后,进行模型的最终优化数据挖掘。发现过程是一个尝试和探索相结合的过程,需要不断尝试和改变参虽来寻找最适合模型评价标准的参量,最终确定出最优的模型。总的来说,对于数据挖掘算法不存在一个普遍使用的算法,算法的适用性和有效性主耍是表现在某一个领域,在实际的算法运用中,需要选择最恰当适用的数据挖掘算法,也就是说不能将已有的算法普遍运川于所令的领域屮,是需要从新的领域的具体需求出发制定最

6、优的数据挖掘算法。3数据挖掘算法与实现根据数据挖掘的不同和度可以将数据挖掘技术划分为不同的种类,例如从发现的知识种类來划分数据挖掘技术,或者从挖掘方法分类,再者是根据挖掘的途径來分类。笔者在此主要从技术的角度來进行分类,对数据挖掘技术中的几个重要的方法做了如下详细阐述:1)决策树方法:决策树方法是数据挖掘算法中的一个重要方法,决策树下的每一个分支是一个决策过程,每一个过程中涉及唯一一-个数据的属性,然后通过不断满足决策条件得到最终的决策结杲。决策树的构造中蕴含着分类规则,其核心内容在于构造精度高、规模小的决策树,具体来说决策树的构造可以分两个主要步骤进行。首先是决策树的生成,其生成过

7、程是rtr训练样本集牛成决策树的过程,数据集一般来说应该是具有现实意义,有一定的综合程度并且用于数据分析处理的。其次是要进行数据集的剪枝,是指对上一步骤中构造的决策树迹行检验、校正和修正。具体来说也就是要运用新的样木数据集来作为测试数据集中的数据检验决策树生成中产生的初步规则,将分支中阻碍预测准确性的部分剪除。2)遗传算法:基于遗传算法的数据挖掘技术是一个模拟生物进化遗传的过程,是在生物进化的思想启发下得出的算法,遗传算法相比较其他优化算法,主要有以下提出

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。