发表评论取消回复
相关阅读
相关 元数据与数据治理|Intellij IDEA提交远程Hadoop MapReduce任务(第八篇)
1.新建IntelliJ下空的的maven项目 ![Image 1][] 直接next即可。 2.配置依赖 编辑pom.xml文件,添加apache源和hado
相关 元数据与数据治理|MapReduce概述(第七篇)
MapReduce是什么 Hadoop MapReduce是一个软件框架,基于此框架能够容易地编写应用程序,这些应用程序能够运行在由上千个商用机器组成的大集群上,并以一种
相关 元数据与数据治理|Spark SQL结构化数据分析(第六篇)
数据科学家们早已熟悉的R和Pandas等传统数据分析框架 虽然提供了直观易用的API,却局限于单机,无法覆盖分布式大数据场景。在Spark1.3.0以Spark SQL原
相关 元数据与数据治理|大数据生态及其技术栈(第三篇)
> 如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系?对于大部分人来说都是傻傻分不清楚。 > > 今年来大数据、人工智能获得了IT界大
相关 元数据与数据治理|Hadoop技术栈(第二篇)
1.Hadoop Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点,其核心是YARN,HDFS和Mapreduce。 ![Imag
相关 元数据与数据治理|使用 Apache Atlas 进行数据治理 (第一篇)
> 面对海量且持续增加的各式各样的数据对象,你是否有信心知道哪些数据从哪里来以及它如何随时间而变化?采用Hadoop必须考虑数据管理的实际情况,元数据与数据治理成为企业级
相关 元数据与数据治理|大数据之数仓平台设计(第十篇)
对于大数据来说,数仓的作用不言而喻,承载着整个公司全业务线的数据,现阶段,在hadoop上的数仓主要是用来解决企业内部数据的分析,尤其是各种各样的统计分析报表。本文主要结合自己
相关 元数据与数据治理|大数据治理(第九篇)
魅族大数据平台的一个技术分享活动,话题是《大数据治理之路》.魅族大数据平台工作人员分享了一些他们的大数据治理经验,很有内容。 首先,他们整理了一个治理流程,架构图
相关 元数据与数据治理|Apache Atlas API使用入门(第十一篇)
一 概念讲解 Apache atlas Api主要是对Type,Entity,Attribute这3个构件的增删改查操作(Api和Admin UI供外部调用,其它的被封装
还没有评论,来说两句吧...