发表评论取消回复
相关阅读
相关 面试篇spark(spark core,spark sql,spark 优化)
一:为什么学习spark? 相比较map-reduce框架,spark的框架执行效率更加高效。 mapreduce的执行框架示意图。 ![在这里插入图片描述][6
相关 Spark之累加器
Spark之累加器 > 累加器:分布式共享只写变量。(Executor和Executor之间不能读数据) > 累加器用来把Executor端变量信息聚合到Driver
相关 spark之Row
hkl曰:直接搞过来官方的API文档,看不懂英文没关系,看它的实例就可以了。 http://spark.apache.org/docs/1.3.1/api/scala/
相关 Spark核心之Spark Streaming
前面说到Spark的核心技术的时候,有和大家说过,有五大核心技术,不知道大家还记不记得; 给大家回忆下,这五大核心技术:分布式计算引擎Spark Core 、基于Hadoo
相关 Spark之Spark Session、Dataframe、Dataset
Spark SQL简介 Spark SQL架构: Spark SQL是Spark的核心组件之一(2014.4 Spark1.0) 能够直接访问现存的Hive数
相关 Spark之Spark内核工作流程
这是一个较为细粒度的Spark运行流程。 我们写的Spark程序叫做Application。 Application会通过spark-submit来提交给Spar
相关 Spark之StructuredStreaming
Structured Streaming相关学习: 简介 Structured Streaming是Spark2.0版本提出的新的实时流框架,是一种基于Spark S
相关 Spark之GraphX
GraphX相关学习: 简介 GraphX 是 Spark 图表和图形并行计算的新组件。GraphX 延伸 Spark [RDD][] 通过引入新的[图形][Link
相关 Spark之Spark概述
Spark之Spark概述 -------------------- 1. 什么是Spark 2. Spark内置项目介绍 3. Spark特点 4. Spar
相关 Spark学习之路 Spark分区
一、分区的概念 分区是RDD内部并行计算的一个计算单元,RDD的数据集在逻辑上被划分为多个分片,每一个分片称为分区,分区的格式决定了并行计算的粒度,而每个分区的数值计
还没有评论,来说两句吧...