欢迎来到天天文库
浏览记录
ID:36651469
大小:1.49 MB
页数:31页
时间:2019-05-13
《数据挖掘工具的选择、分析、比较与展望》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、数据挖掘工具的选择、分析、比较与展望高春华(南京大学计算机科学与技术系,南京,210093)Choice,Analysis,ComparisonandFutureStudiesofDataMiningToolsGAOChun-Hua(DepartmentofComputerScienceandTechnology,NanjingUniversity,Nanjing,210093)Abstract:Asanewtechnologyofderivingknowledgefrommassivedata,d
2、atamininghasbecomeincreasinglypopularinresearchandindustryfields.Itssuccessincommercialareamakessoftwareengineersdevelopnewdataminingtoolsandimprovecurrenttools.Nowwecanseedataminingtoolshavebecomeafeastofeye,soitishardforustochooseproperdataminingtool
3、s.Inordertooffersomehelp,thepaperdiscussessomewaysofchoosingdataminingtools.Atthesametime,itmakesintroductionofseveralfamousdataminingtoolsanddiscussesthestrengthandweaknessofeachtool.ItthenchoosesSPSSClementineasatooltodosomedataminingworkandcompareit
4、withWEKAandSASEM.Finally,ittalksaboutthefeaturesandnewfunctionsoffuturedataminingtools.KeyWords:DataMining;SPSSClementine,Useoftools,Comparativestudies,Futurework摘要:数据挖掘作为一项从海量数据中提取知识的信息技术引起了国内外学术界和产业界的广泛关注,它在商业方面的成功应用使得软件开发商不断开发新的数据挖掘工具,改进现有的数据挖掘工具,一时
5、之间数据挖掘工具可谓琳琅满目,于是出现了如何合理选择挖掘工具的问题。鉴此,本文提出并讨论了几点关于理选择数据挖掘工具的技巧。同时,就现有的几个著名挖掘工具,介绍各自的特点,以及相互的优缺点。然后,选用SPSSClementine这种挖掘工具进行实际操作,并且具体介绍它与Weka、SASEM之间的优缺点。最后,展望一下,未来数据挖掘工具的特点与新功能。关键词:数据挖掘、SPSSClementine、工具使用、工具比较、展望前言:随着信息时代的到来,信息利用的重要性日渐突出,因此数据库和计算机网络随之应
6、运而生。如今数据库和计算机网络被广泛应用,加上先进的数据自动生成和采集工具的使用,人们拥有的数据量急剧增大。然而数据的极速增长与数据分析方法的改进并不成正比,一方面人们希望在已有的大量数据的基础上进行科学研究、商业决策、企业管理,另一方面传统的数据分析工具很难令人满意的对数据进行深层次的处理,这样二者之间的矛盾日益突出,正是在这种状况下,数据挖掘应运而生。数据挖掘作为一项从海量数据中提取知识的信息技术是一个"以发现为驱动"的过程,已经引起了学术界和产业界的极大重视。特别是从1989年8月在美国底特律
7、召开的第11届国际人工智能联合会议上首次出现数据库中的知识发现概念以来,数据挖掘在国际国内都受到了前所未有的重视,目前数据挖掘广泛应用于各个领域,如地理学、地质学、生物医学等等,总之数据挖掘的出现____________作者简介:高春华(1988-),男,江苏海门人,大学本科生,主要研究领域为软件工程,MFC使数据库技术进入了一个更高级的阶段,不仅能对过去的数据进行查询和遍历,还能够找出以往数据间潜在的联系,促进信息的传播。1.数据挖掘定义数据挖掘是一个从数据中提取模式的过程,是一个受多个学科影响的
8、交叉领域,包括数据库系统、统计学、机器学习、可视化和信息科学等;数据挖掘反复使用多种数据挖掘算法从观测数据中确定模式或合理模型,是一种决策支持过程。通过预测客户的行为,帮助企业的决策者调整市场策略,减少风险,做出正确的决策。由于传统的事物型工具(如查询工具、报表工具)无法回答事先未定义的综合性问题或跨部门/机构的问题,因此其用户必须清楚地了解问题的目的。数据挖掘就可以回答事先未加定义的综合性问题或跨部门/机构的问题,挖掘潜在的模式并预测未来的趋势,用户不必提出确切的问
此文档下载收益归作者所有