基于hdfs的云数据备份系统

基于hdfs的云数据备份系统

ID:37179384

大小:53.06 KB

页数:4页

时间:2019-05-21

基于hdfs的云数据备份系统_第1页
基于hdfs的云数据备份系统_第2页
基于hdfs的云数据备份系统_第3页
基于hdfs的云数据备份系统_第4页
资源描述:

《基于hdfs的云数据备份系统》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第2期工矿自动化No.22011年2月IndustryandMineAutomationFeb.2011文章编号:1671-251X201102-0029-04DOI:CNKI:32-1627/TP.20110124.1032.001数据挖掘研究现状及发展趋势王惠中12彭安群121.兰州理工大学电气工程与信息工程学院2.甘肃省工业过程先进控制重点实验室甘肃兰州730050摘要:从数据挖掘的定义出发介绍了数据挖掘的神经网络法、遗传算法、决策树法、模糊集法粗糙集法、和关联规则法等概念及其各自的优缺点详细总结了国内外数据挖掘的研究现状及研究热

2、点指出了数据挖掘的发展趋势。关键词:数据挖掘挖掘算法神经网络决策树粗糙集模糊集研究现状发展趋势中图分类号:TD672文献标识码:B网络出版时间:2011-01-2410:32网络出版地址:http://www.cnki.net/kcms/detail/32.1627.TP.20110124.1032.001.htmlExistingSituationofDataMiningResearchandItsDevelopmentTendency1212WANGHuizhongPENGAnqun1.CollegeofElectricalandI

3、nformationEngineeringofLanzhouUniversityofTechnologyLanzhou730050China.2.KeyLaboratoryofGansuAdvancedControlforIndustrialProcessesLanzhou730050ChinaAbstract:Fromthedefinitionofdataminingthepaperintroducedconceptsandadvantagesanddisadvantagesofneuralnetworkalgorithmdecisi

4、ontreealgorithmgeneticalgorithmroughsetmethodfuzzysetmethodandassociationrulemethodofdataminingsummarizeddomesticandinternationalresearchsituationandfocusofdataminingindetailsandpointedoutthedevelopmenttrendofdatamining.Keywords:dataminingalgorithmofdataminingneuralnetwo

5、rkdecisiontreeroughsetfuzzysetresearchsituationdevelopmenttendency术应运而生2。0引言数据挖掘是一个多学科领域它融合了数据库随着信息技术的迅猛发展许多行业如商业、企技术、机器学习、人工智能、知识工程、统计学、信息科研机构和政府部门等都积累了海量的、业、不同形检索等最新技术的研究成果其应用非常广泛。只式存储的数据资料1。这些海量数据中往往隐含着要是有分析价值的数据库都可以利用数据挖掘工各种各样有用的信息仅仅依靠数据库的查询检索具来挖掘有用的信息。数据挖掘典型的应用领域包机制

6、和统计学方法很难获得这些信息迫切需要能括市场、金融、工业生产、医学、工程诊断科学研究、自动地、智能地将待处理的数据转化为有价值的信等。本文主要介绍数据挖掘的主要算法及其各自的息从而达到为决策服务的目的。在这种情况下优缺点并对国内外的研究现状及研究热点进行了一个新的技术数据挖掘DataMiningDM技详细的总结最后指出其发展趋势及问题所在。收稿日期:2010-10-151数据挖掘算法基金项目:甘肃省教育厅科研项目0903-07国家自然科学数据挖掘就是从大量的、不完全的、有噪声的、基金项目50967001作者简介:王惠中1962-男河南洛

7、阳人教授硕士研究生模糊的、新随机的实际应用数据中提取有效的、颖导师主要研究方向为自动化仪器仪表、嵌入式开发与应用等已潜在有用的知识的非平凡过程3。数据挖掘过的、发表文章31篇。mail:wanghuizhong620124126.comE程如图1所示。这些数据的类型可以是结构化的、30工矿自动化2011年2月半结构化的、甚至是异构型的。发现知识的方法可数据相关性发现、约简、数据意义的评估等问题。其以是数学的、也可以是归纳的。最终被发非数学的、优点是算法简单不需要关于数据的任何预备的或现了的知识可以用于信息管理、查询优化、决策支持额外的信

8、息缺点是难以直接处理连续的属性须先及数据自身的维护等4。进行属性的离散化。因此连续属性的离散化问题是制约粗糙集理论实用化的难点7。粗糙集理论主要应用于近似推理、建立预测数字逻辑分析和化简、模型等问题。图1数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。