发表评论取消回复
相关阅读
相关 离线数仓 (十三) --------- DWD 层搭建
目录 前言 一、DWD 层 (用户行为日志) 1. 日志解析思路 2. get\_json\_object 函数使用
相关 Flink 实时数仓 (一) --------- 数据采集层
目录 一、数仓分层介绍 二、实时需求概览 三、统计架构分析 四、日志数据采集 1. 模拟日志生成器的使用 2. 日志采集
相关 数仓开发之DWD层(四)
目录 十一:工具域优惠券领取事务事实表 11.1 主要任务: 11.2 思路分析: 11.3 图解: 十二:工具域优惠券使用(下单)事务事实表 12.1 主要任务:
相关 数仓开发之DWD层(三)
(附:由于篇幅原因,这里就不在展示代码了,直接告诉大家思路) 目录 五:交易域订单预处理表 5.1 主要任务 5.2 思路分析 5.3 图解 六:交易域下单事务事实
相关 数仓开发之DWD层(二)
目录 三:流量域用户跳出事务事实表 3.1 主要任务 3.2 思路分析 3.3 图解 3.4 代码 四:交易域加购事务事实表 4.1 主要任务 4.2 思路
相关 数仓开发之DWD层(一)
目录 一:流量域未经加工的事务事实表 1.1 主要任务 1.2 思路 1.3 图解 1.4 代码 二:流量域独立访客事务事实表 2.1 主要任务 2.2 思
相关 数据仓库DWD层-离线数仓-大数据
dwd层 > 对ODS层数据进行清洗(去除空值,脏数据,超过极限范围的数据,行式存储改为列存储,改压缩格式) -------------------- 启动日志表
相关 数仓实战04:数仓搭建-DWD层
> 1)对用户行为数据解析 > 2)对核心数据进行判空过滤。 > 3)对业务数据采用维度模型重新建模,即维度退化。 1.用户行为启动表数据解析 1.1创建启动
相关 实时数仓DWS层的定位
实时数仓DWS层的定位 1. 轻度聚合,因为DWS层要应对很多实时查询,如果是完全的明细那么查询的压力是非常大的。 2. 将更多的实时数据以主题的方式组合起来便于管理
相关 实时数仓DWD层业务数据处理解决思路
DWD层业务数据 在实时数仓中业务数据的变化,可以通过Maxwell或者canal等工具采集到,采用MaxWell将全部数据统一写入一个Topic中, 这些数据包括业务数
还没有评论,来说两句吧...