【8A文】Hive内部培训资料.pptx

【8A文】Hive内部培训资料.pptx

ID:32507692

大小:761.54 KB

页数:24页

时间:2019-02-09

【8A文】Hive内部培训资料.pptx_第1页
【8A文】Hive内部培训资料.pptx_第2页
【8A文】Hive内部培训资料.pptx_第3页
【8A文】Hive内部培训资料.pptx_第4页
【8A文】Hive内部培训资料.pptx_第5页
资源描述:

《【8A文】Hive内部培训资料.pptx》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、Hive内部培训顺丰科技-系统与数据集成研发中心-数据集成研发部第一章第二章第三章第四章Hive是什么Hive特性怎么用HiveHive的调优及发展Hive是什么?•Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。•本质是将HQL转换为MapReduce程序Hive关注以下几点:在Hadoop中的数据可扩展的SQL处理可扩展到100PB+结构化和非结构化数据---现阶段公司只是用到结构化的数据Hive的架构简介–在Hadoop生态圈的位置建立在Hive之上的交换层让传统DBA或者Java工程师轻松就能完成更多的工

2、作最终转化成MapReduceJobHive将元数据存储在数据库中,如mysql、derby。Hive中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等。解释器、编译器、优化器完成HQL查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在HDFS中,并在随后有MapReduce调用执行。Hive的数据存储在HDFS中,大部分的查询由MapReduce完成(包含*的查询,比如select*fromtbl不会生成MapRedcue任务)。Hive的架构简介–接口1、Hive将元数据存储在数据库中,如mysql、

3、derby。Hive中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等。2、解释器、编译器、优化器完成HQL查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在HDFS中,并在随后有MapReduce调用执行。3、Hive的数据存储在HDFS中,大部分的查询由MapReduce完成(包含*的查询,比如select*fromtbl不会生成MapRedcue任务)。Hive和普通关系数据库的异同HiveRDBMS查询语言HQLSQL数据存储HDFSRawDeviceorLocalFS索引无有执行MapReduc

4、eExcutor执行延迟高低处理数据规模大小1、查询语言。专门设计了类SQL的查询语言HQL。熟悉SQL开发的开发者可以很方便的使用Hive进行开发。2、数据存储位置。Hive的数据都是存储在HDFS中的。3、数据格式。Hive中没有定义专门的数据格式,数据格式可以由用户指定.4、数据更新。Hive中不支持对数据的改写即没有更新5、执行。Hive中大多数查询的执行是通过MapReduce来实现的。6、执行延迟。hive延迟较高。但由于MR框架大数据量的访问优势明显。7、可扩展性。由于Hive是建立在Hadoop之上的,因此Hive的可扩展性是和Hadoop的可扩展性是一致的(

5、Oracle在理论上的扩展能力也只有100台左右。8、数据规模。由于Hive建立在集群上并可以利用MapReduce进行并行计算,因此可以支持很大规模的数据第一章第二章第三章第四章Hive是什么Hive基本操作怎么用HiveHive的调优及发展Hive基本操作–DDLCreate/Drop/AlterDatabaseCreate/Drop/AlterTableAlterTable/Partition/ColumnCreate/Drop/AlterViewCreate/DropIndexCreate/DropFunctionShowDescribeHive基本操作–托管表和外部

6、表Hive默认创建ManagedTable,由Hive来管理数据,意味着Hive会将数据移动到数据仓库目录。另外一种选择是创建ExternalTable,这时Hive会到仓库目录以外的位置访问数据。如何选择?如果所有处理都由Hive完成,应该使用ManagedTable。如果要用Hive和其它工具来处理同一个数据集,应该使用ExternalTables。托管表外部表CREATE/LOAD把数据已到仓库目录创建表时指明外部数据的位置DROP元数据和数据会被一起删除只删除元数据Hive基本操作–DATABASE在Hive中创建数据库及托管表(内部表)1、登录进入Hivesudo-

7、uhdfshive;2、查看数据库showdatabases;3、创建数据库createdatabaseifnotexistsabc_test;4、进入abc_test数据库useabc_test;5、查看数据库下所有的表showtables;6、创建托管表(内部表:删除表,数据同时被删除)droptableifexistsabc_table_01;createtableabc_table_01(idintcomment'序列',namestringcomment'名称')comment'创建托管表(内

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。