发表评论取消回复
相关阅读
相关 SPARK总结之RDD
一、RDD的概述 1.1 什么是RDD? RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,
相关 Spark理论开山篇(一)
一句话理解Spark是什么 spark是一个基于内存计算的框架,是一种通用的大数据快速处理引擎。 spark的版本支持情况 本文基于Spark2.3.1做阐述说明
相关 Spark RDD弹性分布式数据集——理论
Spark RDD 理论 1.1 RDD简介 1.2 RDD五大特征 1.3 RDD的处理过程 1.4 RDD的分区
相关 Spark之SparkSQL理论篇
Spark SQL 理论学习: 简介 ![20190530191139.png][] Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽
相关 Spark之RDD实战篇
Spark RDD创建、转换、行动算子、RDD的持久化: RDD编程 在Spark中,RDD被表示为对象,通过对象上的方法调用来对RDD进行转换。经过一系列的tran
相关 Spark之RDD实战2
宽窄依赖、DAG RDD相关概念: 依赖 RDD和它依赖的父RDD(s)的关系有两种不同的类型,即窄依赖(narrow dependency)和宽依赖(wide de
相关 Spark之RDD实战篇3
键值对RDD、数据读取与保存、累加器、广播变量: 键值对RDD Spark 为包含键值对类型的 RDD 提供了一些专有的操作 在PairRDDFunctions专门进
相关 Spark之RDD理论篇
Spark的基石RDD: RDD与MapReduce Spark的编程模型是弹性分布式数据集(Resilient Distributed Dataset,RDD),它
相关 Spark之SparkStreaming理论篇
SparkStreaming的相关理论学习: 简介 Spark Streaming用于流式数据的处理。Spark Streaming有高吞吐量和容错能力强等特点。Sp
相关 Spark学习之RDD
RDD概述 什么是RDD > RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个不
还没有评论,来说两句吧...