大数据平台架构及建设思路教程文件.pptx

大数据平台架构及建设思路教程文件.pptx

ID:57254054

大小:1.99 MB

页数:20页

时间:2020-08-04

大数据平台架构及建设思路教程文件.pptx_第1页
大数据平台架构及建设思路教程文件.pptx_第2页
大数据平台架构及建设思路教程文件.pptx_第3页
大数据平台架构及建设思路教程文件.pptx_第4页
大数据平台架构及建设思路教程文件.pptx_第5页
资源描述:

《大数据平台架构及建设思路教程文件.pptx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、大数据平台架构及建设思路2021/10/5中国移动通信集团设计院有限公司三、中国移动大数据平台建设思路二、主流技术比较一、大数据介绍目录运营商对大数据的理解网络数据、用户数据、应用数据的汇聚构成了我们的“大数据”。这些结构化、非结构化的数据的处理和建模形成对用户、服务、资源、终端等对象的洞察。这些洞察与市场营销、网络运维等业务流程的衔接将会给公司带来新的价值。大数据具备Volume海量、Variety多样、Velocity快速、Value价值的特点。据Ericsson预测,到2018年,每个手机终端每个月将

2、产生2G的数据。(EricssonMobilityReport,2013年)改善市场运营效率结构化数据处理非结构化数据处理网络数据•话单XDR•性能监测•故障监测•网络资源用户数据•HSS信息•BSS数据•OSS数据•终端应用数据•内容DPI•Web•Socialmedia•APPS洞察:用户/服务/资源/终端/......提升网络运维效率改善客户满意度创新商业模式数据采集建模分析运营改进传统商业智能大数据1大数据2批处理,事先定义的查询和模型非结构化的数据,包括互联网日志、web文本信息,非实时或准实时流

3、处理,实时的内容智能感知,策略执行,连续更新价值实时性采集、建模和应用数据处理实时性与价值呈正比中国移动数据分布B域B域数据以客户关系、用户行为、产品信息等为主,支撑客户经营和产品营销等O域O域数据以设备数据、告警信息和性能信息等为主,支撑网络监控、网络优化、用户投诉处理等M域M域数据以财务、人力资源、供应链和办公信息等为主,支撑企业管理、企业办公信息化等DPI数据域DPI数据域以上网日志、内容构成、用户轨迹、网络信令等为主,可支撑流量经营、网络运维和增值服务等业务平台九大业务基地:基地数据以用户信息、用户

4、行为信息等为主,可支撑个性化推荐、优化产品和服务等。WAP/短彩信:存储网络日志,可支撑定位网络及终端问题。运营商大数据运用对内:客户上网数据处理、网页爬取和网页分类、分析挖掘客户上网行为详单查询、上网日志查询流量分析、客户视图、精准营销网络运维优化对外:与航空公司合作,建立乘机客户识别模型,提供大数据挖掘、客户发展全流程大数据信息服务,提供针对性的营销方案与交通运输部、省高速公路合作,开展“基于移动大数据分析在交通行业中的应用”研究项目利用通信信令实时分析景区人流量,结合游客的行为数据挖掘,为旅游管理部门

5、、景区提供数据的决策参考以客户授权为依据,发挥移动客户实名数据优势,为互联网金融提供客户信息验真服务与外部客户合作在手机冲浪平台实施移动广告精准投放目前主要的电信运营商都已积极探索开发其内部大数据资源。但从目前的应用发展看,电信运营商的大数据仍主要用于内部服务的,如支持内部的客户流失分析、营销分析和网络优化分析等,对外的应用模式尚未成型,部分电信运营商开始尝试通过给第三方提供数据产品和服务,进行数据的增值。三、中国移动大数据平台建设思路二、主流技术比较一、大数据介绍目录大数据具备数据量大、数据类型多、数据处

6、理速度要求高和价值密度低的特点,传统分析系统架构(RDBMS+小型机+高端阵列模式)下,传统数据库无法支撑海量数据(如100TB以上,性能下降)、非结构化数据,现有IOE的架构无法线性扩展且成本高昂。大数据处理技术大数据对传统数据处理技术体系提出挑战大数据处理技术OldSQL:传统关系型数据库NewSQL:新型MPP数据库,关系型数据库NoSQL:泛指非关系型的数据库Hadoop:对大量数据进行分布式存储和处理的软件框架大数据三大技术比较面对海量种类繁多的数据进行实时数据分析和离线数据分析,仅有传统的数据库

7、技术已不适用,需要针对不同数据场景选择不同技术手段。MPP数据库:适合结构化数据的深度分析、复杂查询以及多变的自助分析类应用、数据集市等。Hadoop:适合海量数据存储查询(详单存储和查询)、批量数据ETL、非结构化数据分析(日志分析、文本分析)等。传统数据库:在复杂关联、汇总、事务处理方面能力强,适合数据量小、高可靠、数据价值密度高的应用。中国移动大数据目标架构数据处理层(数据存储、数据计算、数据共享)基础数据资源池(HADOOP)Map/Reduce2HIVEHbaseHDFS分析数据资源池(MPP)分

8、布式关系数据仓库SPARKSharkYARN统一调度流处理资源池分布式内存数据库实时行为识别复杂事件处理框架实时模型计算任务调度资源管理统一作业数据管理元数据管理数据质量管理经分数据模型计算网络数据模型计算管理分析模型计算…数据调度Hadoop平台软件部署于Hadoop大数据处理集群,实现海量非结构化数据存储与处理以及结构化数据的垂直汇总。在当前数据种类繁多、数据处理复杂的情形下,不适合采用一种的单一的技术解决全

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。