1大数据概述课件

1大数据概述课件

ID:18520099

大小:2.99 MB

页数:31页

时间:2018-09-18

1大数据概述课件_第1页
1大数据概述课件_第2页
1大数据概述课件_第3页
1大数据概述课件_第4页
1大数据概述课件_第5页
资源描述:

《1大数据概述课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、大数据概述教材第1章重点与难点内容:大数据的概念和应用、大数据与云计算、物联网的关系。重点:理解大数据的概念、大数据与云计算、物联网的关系。难点:大数据对科学研究、思维方式和社会发展的影响。内容提纲1.1大数据时代1.2大数据概念1.3大数据的影响1.4大数据的应用1.5大数据关键技术1.6大数据计算模式1.7大数据产业1.8大数据与云计算、物联网的关系1.1大数据时代第三次信息化浪潮根据IBM前首席执行官郭士纳的观点,IT领域每隔十五年就会迎来一次重大变革表1-1三次信息化浪潮信息化浪潮发生时间标志

2、解决问题代表企业第一次浪潮1980年前后个人计算机信息处理Intel、AMD、IBM、苹果、微软、联想、戴尔、惠普等第二次浪潮1995年前后互联网信息传输雅虎、谷歌、阿里巴巴、百度、腾讯等第三次浪潮2010年前后物联网、云计算和大数据信息爆炸将涌现出一批新的市场标杆企业信息科技为大数据时代提供技术支撑图1-1存储价格随时间变化情况1.存储设备容量不断增加信息科技为大数据时代提供技术支撑图1-3CPU晶体管数目随时间变化情况2.CPU处理能力大幅提升信息科技为大数据时代提供技术支撑图1-4网络带宽随时间

3、变化情况3.网络带宽不断增加信息科技为大数据时代提供技术支撑图1-4网络带宽随时间变化情况3.网络带宽不断增加数据产生方式的变革促成大数据时代的来临图1-5数据产生方式的变革信息时代三定律定律名称内容摩尔定律每平方英寸硅芯片上的晶体管数目每18个月到24个月将增加一倍。40年来,这个预言每每应验,而且后人又增加一条:“价格同时下降一半”。摩尔定律揭示了信息技术进步的速度,铸造数据滋生的利器!吉尔德定律预测互联网的带宽每6个月增长1倍,其增长速度是摩尔定律预测的CPU增长速度的3倍。并预言将来上网会免费

4、。吉尔德定律(又称胜利者浪费定律):大带宽支撑大数据麦特卡尔定律预测网络的价值与网络用户数的平方成正比。也就是说,N个连结创造出N×N的效益。上网的人数越多,产生的效益越多。麦特卡夫定律:大数据价值是用户创造的大数据的发展历程阶段时间内容第一阶段:萌芽期上世纪90年代至本世纪初随着数据挖掘理论和数据库技术的逐步成熟,一批商业智能工具和知识管理技术开始被应用,如数据仓库、专家系统、知识管理系统等。第二阶段:成熟期本世纪前十年Web2.0应用迅猛发展,非结构化数据大量产生,传统处理方法难以应对,带动了大数

5、据技术的快速突破,大数据解决方案逐渐走向成熟,形成了并行计算与分布式系统两大核心技术,谷歌的GFS和MapReduce等发数据技术受到追捧,Hadoop平台开始大行其道第三阶段:大规模应用期2010年以后大数据应用渗透各行各业,数据驱动决策,信息社会智能化程度大幅提高表1-2大数据发展的三个阶段1.2大数据概念大数据的定义一般意义上,大数据是指无法在可容忍的时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。泛指一个时代、一项技术、一种文化、一个挑战。(通常也是大数据集、大

6、数据技术与大数据应用的总称)大数据的特点:1、数据量大(Volume)根据IDC作出的估测,数据一直都在以每年50%的速度增长,也就是说每两年就增长一倍(大数据摩尔定律)人类在最近两年产生的数据量相当于之前产生的全部数据量预计到2020年,全球将总共拥有35ZB的数据量,相较于2010年,数据量将增长近30倍存储单位换算关系含义与实例bit二进制位Byte1B=8bitKB(Kilobyte,千字节)1KB=1024B=210BMB(Megabyte,兆字节)1MB=1024KB=220B1张照片约2

7、MBGB(Gigabyte,吉字节)1GB=1024MB=230B1部高清电影大约1GBTB(Trillonbyte,太字节)1TB=1024GB=240BeBay每天产生的数据量约为50TBPB(Petabyte,拍字节)1PB=1024TB=250BGoogle每月需要处理的数据量约600PBEB(Exabyte,艾字节)1EB=1024PB=260B美国的医疗数据量约为150EBZB(Zettabyte,泽字节)1ZB=1024EB=270B2013年全球数据量预计4ZBYB(Yottabyte

8、,尧字节)1YB=1024ZB=280B2029年全球数据量预计达1YB2、数据类型繁多(Variety)大数据是由结构化和非结构化数据组成的10%的结构化数据,存储在数据库中90%的非结构化数据,它们与人类信息密切相关非结构化数据类型多样邮件、视频、微博位置信息、链接信息手机呼叫、网页点击“长微博”3、处理速度快(Velocity)从数据的生成到消耗,时间窗口非常小,可用于生成决策的时间非常少1秒定律:这一点也是和传统的数据挖掘技术有着本质的不同4、价

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。