发表评论取消回复
相关阅读
相关 SparkCore RDD概述
1 RDD 概述 1.1 什么是 RDD RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是 Spark 中最基本...
相关 SparkCore之RDD持久化与检查点设置
SparkCore之RDD持久化与检查点设置 1. RDD Cache缓存 RDD通过Cache或者Persist方法将前面的计算结果缓存,默认情况下会把数据以序列
相关 SparkCore之RDD序列化
SparkCore之RDD序列化 > 在SparkRDD编程中,初始化工作是在Driver端进行的,而实际运行程序是在Executor端进行的,涉及到了跨进程通信,是需要
相关 SparkCore(四):RDD基础编程
文章目录 一、RDD行动算子 1.1 reduce 1.2 collect 1.3 count 1.4 fir
相关 SparkCore(三):RDD转换算子
文章目录 一、Value类型 1.1 map 1.2 mapPartitions 1.3 mapPartitionsWith
相关 SparkCore(二):RDD基础
文章目录 一、什么是RDD 二、RDD核心属性 三、RDD执行原理 四、RDD创建 `Spark`计算框架为了能够进行高并发和高吞吐的数据处理,
相关 【Spark入门(2)】SparkCore之RDD核心编程
【时间】2021.10.26 【题目】【Spark入门(2)】SparkCore之RDD核心编程 一、引言 本文是课程[尚硅谷大数据Spark教程][Sp
相关 Spark系列--SparkCore(二)RDD创建方式
一、RDD的创建方式 创建RDD的创建方式大概可以分为三种: 从集合中创建RDD; 从外部存储创建RDD; 从其他RDD转换。 1.1 从集合中创
相关 Spark系列--SparkCore(一)RDD简介
前言 RDD是Spark的基石,是实现Spark数据处理的核心抽象。那么RDD为什么会产生呢? Hadoop的MapReduce是一种基于数据集的工作模式,面向数据,这
相关 Spark系列--SparkCore(六)RDD分区详解
转载自:[https://blog.csdn.net/jiangsanfeng1111/article/details/78191891][https_blog.csdn.ne
还没有评论,来说两句吧...