发表评论取消回复
相关阅读
相关 离线数仓 (五) --------- 电商业务简介
目录 一、电商业务流程 二、电商常识 1. SKU 和 SPU 2. 平台属性和销售属性 三、电商系统表结构 -------
相关 离线数仓 (四) --------- 用户行为数据采集模块
目录 一、集群所有进程查看脚本 二、Hadoop安装 1. HDFS存储多目录 2. 集群数据均衡 3. 支持 LZO
相关 电商离线数仓-拉链表(面试常问)
拉链表详解 拉链表概念 拉链表更新数据 拉链表形成过程 如何使用拉链表 拉链表概念 拉链表,记录每条信息的生命周期为单位,一旦记录的生命周
相关 电商离线数仓-业务数仓指标(GMV主题/转化率主题)
GMV和转化率 GMV主题 GMV的概念 GMV表的创建 GMV表里导入数据 转化率 转化率概念
相关 电商离线数仓项目-用户每日行为宽表(重点!!)
为什么要建立宽表? 需求目标,把每个用户单日的行为聚合起来组成一张多列宽表,以便之后关联用户维度信息后进行不同角度的统计分析。 分析宽表 以用户为主体,今天下了多
相关 电商离线数仓项目-数仓分层哪几层?/数仓为什么要分层?
电商离线数仓 数仓分成哪几层? 数仓为什么要分层? 电商离线数仓项目中的数仓 数仓分成哪几层? 1、ODS层(原始数据层):存放原始数据,直接加
相关 电商离线数仓项目-ETL拦截器/日志类型区分拦截器
Flume里面涉及到拦截器对数据进行处理: ![在这里插入图片描述][watermark_type_ZHJvaWRzYW5zZmFsbGJhY2s_shadow_50_te
相关 电商离线数仓项目-生产Flume数据采集的配置(配置文件详解)
我们经常一提到Flume,就要想到Flume的三个部件,Source,Channel,Sink.这三个部件构成了Flume数据传输的通道. 在我们这个项目当中,收集Flum
还没有评论,来说两句吧...