发表评论取消回复
相关阅读
相关 大数据(三)大数据技术栈发展史
一、总览 大数据技术栈非常多估计大大小小多达上百种。但发展史、技术体系仍有迹可循。我们从数据采集、清洗、应用3大步骤来看,在每个步骤内部按照时序标识主流技术栈时间点。以此
相关 元数据与数据治理|MapReduce概述(第七篇)
MapReduce是什么 Hadoop MapReduce是一个软件框架,基于此框架能够容易地编写应用程序,这些应用程序能够运行在由上千个商用机器组成的大集群上,并以一种
相关 元数据与数据治理|Spark SQL结构化数据分析(第六篇)
数据科学家们早已熟悉的R和Pandas等传统数据分析框架 虽然提供了直观易用的API,却局限于单机,无法覆盖分布式大数据场景。在Spark1.3.0以Spark SQL原
相关 元数据与数据治理|大数据生态及其技术栈(第三篇)
> 如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系?对于大部分人来说都是傻傻分不清楚。 > > 今年来大数据、人工智能获得了IT界大
相关 元数据与数据治理|Hadoop技术栈(第二篇)
1.Hadoop Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点,其核心是YARN,HDFS和Mapreduce。 ![Imag
相关 元数据与数据治理|学习汇总
以下是学习元数据与 数据治理的整个过程:包含技术总结和心里变化情况 以日志的形式进行汇总 2019.1.4 (第一天:接触需求) 需求定义 第一天 讲
相关 元数据与数据治理|使用 Apache Atlas 进行数据治理 (第一篇)
> 面对海量且持续增加的各式各样的数据对象,你是否有信心知道哪些数据从哪里来以及它如何随时间而变化?采用Hadoop必须考虑数据管理的实际情况,元数据与数据治理成为企业级
相关 元数据与数据治理|大数据之数仓平台设计(第十篇)
对于大数据来说,数仓的作用不言而喻,承载着整个公司全业务线的数据,现阶段,在hadoop上的数仓主要是用来解决企业内部数据的分析,尤其是各种各样的统计分析报表。本文主要结合自己
相关 元数据与数据治理|大数据治理(第九篇)
魅族大数据平台的一个技术分享活动,话题是《大数据治理之路》.魅族大数据平台工作人员分享了一些他们的大数据治理经验,很有内容。 首先,他们整理了一个治理流程,架构图
还没有评论,来说两句吧...