数据挖掘技术研究综述

数据挖掘技术研究综述

ID:33499369

大小:410.69 KB

页数:4页

时间:2019-02-26

数据挖掘技术研究综述_第1页
数据挖掘技术研究综述_第2页
数据挖掘技术研究综述_第3页
数据挖掘技术研究综述_第4页
资源描述:

《数据挖掘技术研究综述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据库与信息管理本栏目责任编辑:闻翔军数据挖掘技术研究综述12王毅凯,张大雷(1.扎赉诺尔区广播电视局,内蒙古满州里021410;2.淮南师范学院信息技术系,安徽淮南232001)摘要:随着信息技术的发展,积累了越来越多的数据。数据挖掘技术通过从数据库中发现知识,为人类处理这些海量数据提供了有力武器。首先介绍了数据挖掘技术的概念,然后对数据挖掘系统的构成和数据挖掘的流程进行了分析,最后详细分析了数据挖掘的常用方法。关键词:数据挖掘;数据挖掘系统;数据挖掘方法中图分类号:TP311文献标识码:A文章编号:1009-3044(2008)11-20204-03ResearchofDataMin

2、ingTechnologyWANGYi-kai1,ZHANGDa-lei2(1.ZhanuolaierBroadcastandTVBureau,Manzhouli021410,China;2.DepartmentofInformationandTechnology,HuaiNanNormalUniversity,Huainan232001,China)Abstract:Withthedevelopmentoftheinformationtechnology,moreandmoredatahasbeencreated.DataMiningtechnologycandis-coverknow

3、ledgefromdatabases,providingapowerfulweaponforpeople.Inthispaper,theconceptofDataMiningtechnologyisintro-ducedfirst.AndthentheDataMiningsystemandtheprocessofDataMiningareanalysed.AtlastsomecommonmethodsofDataMiningareexplainedindetail.Keywords:DataMining;DataMiningSystem;DataMiningMethod1引言数据挖掘(D

4、ataMining)又被称为知识发现(KDD,KnowledgeDiscoveryinDatabase),就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,发现隐含的、规律性的、人们事先未知的、但又是潜在有用的、并且最终可以理解的信息和知识的过程。为什么我们需要对数据进行挖掘?可以从商业需求和技术的角度来看待这个问题。从商业需求的角度来看主要有三种原因:(1)大量数据被收集和保存在数据库中,例如web数据、电子商务、信用卡的支付记录等等。(2)计算机已经变得越来越廉价,而功能则日益增强。(3)日益剧烈的商业竞争的压力。从技术的角度来看也有三种原因:(1)数据的存储和收集更加高速。(

5、2)传统的技术对于这些大量的原始数据是不能胜任的。(3)数据挖掘能够帮助科学家分类和划分数据。因为上述这些原因,数据挖掘被认为是解决当今时代所面临的数据爆炸而信息贫乏问题的一种有效方法。2数据挖掘系统的构成数据挖掘系统具有以下主要成分,如图1所示。(1)数据库、数据仓库、万维网或其他信息库:这是一个或一组数据库、数据仓库、电子数据表或其他类型的信息库,可以对这些数据进行数据清理和集成。(2)数据库或数据仓库服务器:根据用户的数据挖掘请求,数据库或数据仓库服务器负责提取相关数据。(3)知识库:这是领域知识,用于指导搜索或评估结果模式的兴趣度。(4)数据挖掘引擎:这是数据挖掘系统的基本部分,

6、理想情况下由一组功能模块组成,用于执行特征化、关联和相关分析、分类、预测、聚类分析、离群点分析和演变分析等任务。(5)模式评估:通常该成分使用兴趣度度量,并与数据挖掘模块交互,以便将搜索聚焦在有趣的模式上。(6)用户界面:该模块在用户和数据挖掘系统之间通信,允许用户与图1数据挖掘系统的构成系统交互。收稿日期:2008-02-25作者简介:王毅凯(1978-),男,助理工程师,工学学士学位,主要从事数据库及通信方面的工作;张大雷(1980-),男,助教,工学硕士学位,主要从事网络通信、网络安全及数据库方面的工作。204电脑知识与技术本栏目责任编辑:闻翔军数据库与信息管理3数据挖掘的主要流程

7、数据挖掘是指一个完整的过程,该过程从大型数据库中挖掘先前未知的、有效的、实用的信息,并使用这些信息做出决策或丰富知识。数据挖掘主要包括以下步骤,如图2所示:图2数据挖掘的流程其中各步骤内容为:(1)确定业务对象清晰定义出业务问题、认清数据挖掘的目的是数据挖掘的重要一步。为了提出一个有意义的问题的陈述,拥有领域内详尽的知识和经验是必不可少的。(2)数据准备①数据的选择搜索所有与业务相关的内部和外部数据信息,并从中选择出适用于数据挖掘应

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。