发表评论取消回复
相关阅读
相关 Hadoop系列之 MapReduce 性能优化(32)
MapReduce 性能优化 对 MapReduce 作业进行性能调优,需要从 MapReduce 的原理出发。下面来重温一下 MapReduce 原理,并对各个阶段进行
相关 Hadoop系列之MapReduce 计数器(31)
MapReduce 计数器 计数器是收集作业统计信息的有效手段之一,用于质量控制或者应用级统计。计数器还可用于辅助诊断系统故障。如果需要将日志信息传输到 map 或 re
相关 Hadoop系列之MapReduce 数据本地化 (29)
MapReduce 数据本地化 数据本地化是指把计算移动到数据所在节点上进行执行的过程,也就是通常所说的 “移动计算而不是移动数据”。移动计算比移动数据具有更大的优势,它
相关 Hadoop系列之MapReduce InputSplit 与 HDFS块(28)
MapReduce InputSplit 与 HDFS 块 InputSplit 即数据分片,HDFS 块(block)即分布式存储系统的数据块概念。下面详细介绍这两个概
相关 Hadoop系列之MapReduce OutputFormat(27)
MapReduce OutputFormat Hadoop OutputFormat 负责检验 job 的输出规范,RecordWriter 把输出数据写到输出文件的具体
相关 Hadoop系列之MapReduce Partitioner(26)
MapReduce Partitioner MapReduce Partitioner 是用来对 mapper 输出的数据进行分区的。partitioner 通过哈希函数
相关 Hadoop系列之MapReduce RecordReader(25)
MapReduce RecordReader 为了理解 MapReduce 框架的 RecordReader 原理,首先得搞清楚 Hadoop 的数据流程。下面我来了解一
相关 Hadoop系列之MapReduce InputSplit(24)
MapReduce InputSplit ![mapreduce inputsplit原理][mapreduce inputsplit] Hadoop InputSp
相关 Hadoop系列之MapReduce InputFormat(23)
MapReduce InputFormat Hadoop InputFormat 会检查作业的数据输入规范,它把输入文件分割成 InputSplit 分片,并发送给 Ma
相关 Hadoop中 MapReduce中InputSplit的分析
前言 MapReduce的源码分析是基于Hadoop1.2.1基础上进行的代码分析。 什么是InputSplit InputSplit是指分片,在MapRedu
还没有评论,来说两句吧...