阿里数据整合及数据管理体系解读

阿里数据整合及数据管理体系解读

ID:69485766

大小:2.50 MB

页数:7页

时间:2021-11-05

阿里数据整合及数据管理体系解读_第1页
阿里数据整合及数据管理体系解读_第2页
阿里数据整合及数据管理体系解读_第3页
阿里数据整合及数据管理体系解读_第4页
阿里数据整合及数据管理体系解读_第5页
阿里数据整合及数据管理体系解读_第6页
阿里数据整合及数据管理体系解读_第7页
资源描述:

《阿里数据整合及数据管理体系解读》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、..前段时间给大家推荐了?大数据之路--阿里巴巴大数据实践?,这本书确实容非常详实,全是干货,值得反复品味。刚刚看完第9章,讲的是数据整合及管理体系,觉得非常好,设计得非常精妙,只看看觉得还不能深刻理解,遂做个读书笔记按照自己理解重构整理一遍,同时补充上自己的解读分享给大家,推荐给准备搭建数据产品或者数据平台的人。传统企业的业务变化相对不快,但使用一般的表格文档来管理数据过程也已经越来越困难,更况互联网这样迅速变化的业务,做好数据整理及管理的难度可想而知,但阿里的数据团队还是形成了完成的法体系,并把其工具化。也只有完备法体系下构建的工

2、具能满足复杂的数据管理需求。阿里大数据建立法论的核心就是,从业务架构设计到模型设计,从数据研发到数据效劳,做到数据可管理、可追溯、可躲避重复建立。目标是建立统一的、规的数据接入层〔ODS〕和数据中间层〔DWD和DWS〕,通过数据效劳和数据产品,完成效劳于阿里巴巴的大数据系统建立。所以数据管理体系是包含具体的法论以及相关的产品两个局部,通过产品把法论固化为标准的流程和操作,到达数据管理的目的。数据体系架构数据管理体系包括了业务板块划分、数据域提炼、业务过程梳理、原子指标/度量定义、派生指标定义及管理,维度分析整理以及数据模型的设计。通过

3、下面的体系架构图来看看数据体系建立的过程、以及每一步做什么和如做。另外,如定义每个术语的涵义,准确定义术语非常关键,有时候描述不清楚复杂的流程、场景最根本是因为对其中的一些概念没有非常很好的厘清。-.可修编...业务板块:根据业务的属性划分出相对独立的业务板块,业务板块间指标和业务重叠性较低,比方电商板块涵盖淘宝、天猫、天猫国际、B2B系,金融板块涵盖支付宝、花呗、蚂蚁微贷等。业务板块非常宏观,可以想象成贾不死的7大生态。规定义:结合行业的数据仓库建立经历和阿里数据自身的特点,设计出的一套过程法和数据规命名体系,规定义将用于模型设计中

4、。规定义指以维度建模作为理论根底,构建总线矩阵,划分和定义数据域、业务过程、原子指标/度量、修饰类型、修饰词、时间期、派生指标规那么,下列图是它们之间的关系,以及具体实例。规定义实例-.可修编...模型设计:以建模理论为根底,基于维度建模总线架构,构建一致性的维度和事实,同时设计出一套表命名规系统。维度建模理论很多书上都讲过,这里就不单独整理了。术语定义及说明我们重点说说数据域、业务过程、修饰词、原子指标、派生指标。数据域:是面向业务分析的,将业务过程或者维度进展抽象组合的集合。其中业务过程是一个个不可拆分的行为事件,在业务过程之下定

5、义指标;维度是指度量的环境,如买家下单事件,买家是维度,订单数量是度量。数据域是抽象提炼出来的,并且不轻易变动,既能涵盖当前所有业务的业务需要,又能在新业务进入时无影响的分配到已有的数据域中,如果所有分类都不适宜才会扩展新的数据域。数据域不同于产品的功能模块和业务线,是从分析的角度来组织数据指标、维度,功能模块是面向用户功能和管理功能的分类。从下面的两个表格能很清楚的看出不同,功能模块和业务线是随时扩展的。那么划分数据域有什么作用呢?主要是因为经过抽象后数据域相对功能模块和业务过程来说少很多,是有效归纳、组织业务过程的式、同时便定位指

6、标/度量。业务过程:指企业的业务活动事件,如下单、支付、退款都是业务过程,这里要注意,业务过程是一个不可拆分的行为事件。-.可修编...修饰词:指除了统计维度以外的对指标进展限定抽象的业务场景词语,修饰词隶属于一个修饰类型,如在日志域的访问终端类型下,有修饰词PC端、无线端,有点像属性名和具体属性值的意思。修饰类型是为了便管理、使用修饰词。原子指标:和度量含义一样,基于某一业务时间行为下的度量,不可拆分的指标,具有明确业务含义的名词,如支付金额。原子指标有确定的字段名称〔中英文〕、数据类型、算法说明、所属的数据域和业务过程。原子指标名

7、称=动作+度量,例如支付金额、注册用户数。除了这些标准度量值的原子指标,还有些是为了派生指标而建的原子指标,后面讲派生规那么时会说到,例如排名型的top_xxx_xxx。派生指标: =一个原子指标+多个修饰词+时间期。可以理解为对原子指标业务统计围的圈定,说总支付金额是个笼统的高度概括的汇总指标,其业务围时间并不明确。加上修饰词后的派生指标如:最近1天买家支付金额〔最近1天是时间期、是修饰词、买家作为维度〕。派生指标的英文名=原子指标英文名 + 时间期修饰词+序号〔_002〕;中文名由时间期修饰词+【其它修饰词】+原子指标。下列图是常

8、用的时间期修饰词,整理的非常详细-.可修编...最后说说派生指标的类型和不同类型指标的生成规那么,这里的规那么不容易理解,需要结合例子花些时间慢慢体会为什么有的是在原子指标的根底上派生,有的必须新建原子指标然后再派生。其

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。