基于云计算的数据挖掘之综述研究.doc

基于云计算的数据挖掘之综述研究.doc

ID:52370757

大小:66.50 KB

页数:5页

时间:2020-03-27

基于云计算的数据挖掘之综述研究.doc_第1页
基于云计算的数据挖掘之综述研究.doc_第2页
基于云计算的数据挖掘之综述研究.doc_第3页
基于云计算的数据挖掘之综述研究.doc_第4页
基于云计算的数据挖掘之综述研究.doc_第5页
资源描述:

《基于云计算的数据挖掘之综述研究.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于云计算的数据挖掘之综述研究摘要随着现代科技的不断发展,云计算时代已经到来,云计算系统具有庞大的信息存储空间。云计算的数据挖掘成为一种新型数据统计力量,能够超越传统的数据挖掘所不适应的问题,并且能够不断增长高效、可信的数据信息。本文粗浅的介绍了云计算的含义、特点及发展方向,分析了云计算技术的数据挖掘的优势,将云计算技术发展中存在的问题提出相应的解决办法。【关键词】云计算数据挖掘综述研究云计算是由海量存储和随意变化的计算方式,数据挖掘是从云计算的信息存储中的大量、不全面、模糊信息11随机的数据中,提取内在的、有需耍的信

2、息和资源。“云”的存储数据不断增长,传统的数据挖掘己经不能完全挖掘出数据的内在信息,所以对数据挖掘提出了最新要求,云计算处理系统具有海量信息存储和随意变化的功能,能够成功挖掘所需的内在资源,成为解决大量数据挖掘的最佳挖掘方式。1云计算的含义随着云计算的发展进程,至今为止并没有一个确定的定义方式,云计算的快速发展,其定义也是一个动态的变化。网络上对于云计算的定义是:云计算是因特网的一种计算,以请求的方式将信息资源分配到计算机设备上,类似于公共的基础设施。第二届中国云计算大会上对云计算是这样定义的:云计算是一种以互联网为平

3、台,大众参与的计算模式,计算资源是虚拟性的,这些虚拟资源是由存储能力、计算能力、互换能力组成。TT的基础设施的使用模式,通过网络按照需要、扩展的方法获得资源。提供资源的网络被称为“云”。云计算与计算(ParallelComputing)>分布式计算(DistributedComputing)和网格计算(GridComputing)平行发展,将计算机科学商业的展现。云计算是虚拟化(Virtualization)、效用计算(UtilityComputing)xTaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软

4、件即服务)等概念的混合升级版本。2云计算的特点2.1服务器规模巨大“云”的规模非常强大,Google现已经拥有上百万的服务器,成为全球最人规模的云计算处理系统,TBM、微软、Yahoo等国际知名企业也均拥有50刀台以上的服务器。云系统具有能够对信息作出超强的计算能力。2.2资源虚拟化云计算功能可以支持用户的不同地理位置、各种终端获取的服务,数据资源是动态且无形的,用户无需接触到它的存在位置,只是在“云”的某处运行。2.3可靠性高云系统的数据可以采用多副本、备份等措施來保障数据的可靠、安全性。2.4通用性通用性是指在云系

5、统的支持下,构建出千变万化的应用,应用的运行也是基于“云”的支撑。2.5可扩展性“云”的规模也可以通过扩展、伸缩而满足应用和用户规模的不断增长需求。2.6按需服务云系统的支持方式可以按照用户的需要进行自行购买。2.7价格低廉云系统无需负担高数据屮心的管理成本,但这并不影响云系统的资源利用率。3云计算的现状与发展云计算是最近热门应用词,“云”将多种技术混合,应用领域的广泛成功公司还包括Salesforce、FacebooknYoutubeMyspace等。云计算在我国发展非常迅猛,早在2008年,IBM在屮国建立了第一个

6、云计算中心。国际上,Google是云计算最大使用者,在地图、Gmail>Docs同步使用了云计算技术。IBM公司随后推出了用户即买即用的云计算平台。微软公司随即推出了WindowsAzure操作系统,通过互联网打造全新的云计算平台,这是即DOS后微软的又一次成功。4云计算的数据挖掘优势及实例4.1数量数据的挖掘由于数据的范围大,从大范I韦I数据内挖掘出所需知识,需要具有大规模的挖掘技术,并且互联网用户的快速增长,数据挖掘任务相比用户搜索任务更为复杂,所以,数据的挖掘过程需要具备良好的开发和应用环境,非常适合使用云计算的

7、方式。4.2降低运行成本云计算的运行成本非常低,并但可以并行于各种计算环境,所以,企业中的数据处理不再依靠于高性能的服务器,使用云计算降低企业的运行成本。4.3挖掘方便、处理能力强云计算的数据挖掘非常全血、便捷,云计算能够利用原有设备,提高大规模数据的处理能力及速度,保证了数据的有效性。中国最早的云计算平台的数据挖掘系统之一的PDMiner由中国科学院计算技术研究所开发,是基于云计算平台Hadoop的分布式数据挖掘平台。数据挖掘工具包,同时将件该软件和平台结合在一起,实现了软件在“云”平台上的转移5结论综上所述,云计算

8、是一种动态定义,随着信息科技的发展,云计算将应用在各个领域中。数据挖掘是从云计算的信息存储中的大量、不全面、模糊信息、随机的数据中,提取内在的、有用的信息和资源。文章中介绍了云计算的特点及发展方向,并对云计算技术的数据挖掘优势进行分析,随着云计算技术的发展进步,定会给数据挖掘带來更好的技术支持与新突破。参考文献[1]黄章树,刘晴晴

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。