发表评论取消回复
相关阅读
相关 离线数仓 (六) --------- 业务数据采集模块
目录 一、MySQL 安装 1. 安装包准备 2. 安装 MySQL 3. 配置 MySQL 二、业务数据生成
相关 黑马Hive+Spark离线数仓工业项目--数仓事实层DWB层构建(1)
整体目标:构建数仓中的DWB:主题事务事实表 核心的主题事实的构建:SQL实现 + 主题的指标 原始事务事实数据【DWD】:订单数据 ![4f76920ec4ec4cea
相关 Hive+Spark离线数仓工业项目--数仓维度层DWS层构建(1)
维度建模回顾:建模流程 目标:掌握维度建模的建模流程 实施 step1-需求调研:业务调研和数据调研 \- 了解整个业务实现的过程 \- 收集所有数据使用人员对
相关 Hive+Spark离线数仓工业项目实战--数仓设计及数据采集(2)
MR的Uber模式 目标:了解MR的Uber模式的配置及应用 实施 \- Spark为什么要比MR要快 \- MR慢 \- 只有Map和Reduce阶段,每个阶
相关 Hive+Spark离线数仓工业项目实战--数仓设计及数据采集(1)
数仓设计及数据采集 1. \\数据仓库设计\\ \- 建模:维度建模:【事实表、维度表】 \- 分层:ODS、DW【DWD、DWM、DWS】、APP \- \
相关 Hive+Spark离线数仓工业项目实战--环境构建(3)
项目环境配置 根据需求实现项目环境配置 实施 \- 注意:所有软件Docker、Hadoop、Hive、Spark、Sqoop都已经装好,不需要额外安装配置,启动即可
相关 Hive+Spark离线数仓工业项目实战--项目介绍及环境构建(1)
项目简介 通过大数据技术架构,解决工业物联网制造行业的数据存储和分析、可视化、个性化推荐问题。一站制造项目主要基于Hive数仓分层来存储各个业务指标数据,基于sparkSQL
还没有评论,来说两句吧...