发表评论取消回复
相关阅读
相关 数仓工具—Hive架构服务(16)
Hive 服务详解 前面我们学习[数仓工具—Hive的架构设计][Hive] 的时候学到了很多概念,像元数据服务什么的,其实架构设计里的每一项都对应的是一种服务或者是一个
相关 数仓工具—Hive架构之HiveServer2(14)
HiveServer 简介 今天我们学习一下Hive 架构中的重要一员HiveServer2或者是HiveServer1,HiveServer2使得其他语言访问Hive
相关 数仓工具—Hive的架构设计(13)
Hive的架构 我们知道MapReduce和Spark它们提供了高度抽象的编程接口便于用户编写分布式程序,它们具有极好的扩展性和容错性,能够处理超大规模的数据集。这些计算
相关 数仓工具—Hive关键字(11)
Hive中的关键字 关键字是任何一门语言中都要的一些字符,这些字符都有特殊的含义,一般情况下用户不能直接使用的,因为编译器对关键字是有特殊处理的。 Hive有一些保留的
相关 数仓工具—Hive streaming(10)
streaming HIVE是通过利用或扩展Hadoop的组件功能来运行的,常见的抽象有InputFormat、OutputFormat、Mapper、Reducer,还
相关 数仓工具—Hive优化
数据过滤 行过滤 行处理:在分区剪裁中,当使用外关联时,如果将副表的过滤条件写在Where后面,那么就会先全表关联,之后再过滤, 列过滤 列处理
相关 数仓工具—Hive架构之Metastore(16)
文章目录 Metastore Metadata Metastore作用 Metastore 服
相关 数仓工具—Hive实战之留存分析(8)
留存分析 留存的定义其实很简单,那就是如果用户昨天使用了我们的平台,今天也使用了那说就是留存用户,也就是一日留存,同理如果明天还来的话,那就是两日留存,举个例子如果用户在
相关 数仓工具—Hive实战之累计计算(7)
累计计算 对于数仓而言,我们一般都是增量计算,增量数据同步、增量数据计算,然后我们产出每天的指标,大多数情况下都是这样的,但是我们也有很多的指标需要把过去的数据和当前的数
相关 数仓工具—Hive Beeline(21)
Beeline 前面我们介绍过hive 的命令行,其实就是hive 的老版命令行,你可以参考[Hive命令行][Hive],今天我们介绍一下hive 新的命令行beeli
还没有评论,来说两句吧...