发表评论取消回复
相关阅读
相关 大数据压缩算法总结
1:最主流的四种 gzip 压缩比较高,不可 split (行文件),hadoop 自带 (apache 协议) lzo 支持 split,但需要额外的索引文件,自定安装(
相关 hive大数据倾斜总结
在做Shuffle阶段的优化过程中,遇到了数据倾斜的问题,造成了对一些情况下优化效果不明显。主要是因为在Job完成后的所得到的Counters是整个Job的总和,优化
相关 大数据量,海量数据 处理方法总结
大数据量,海量数据 处理方法总结(一) 大数据量的问题是很多面试笔试中经常出现的问题,比如baidu google 腾讯 这样的一些涉及到海量数据的公司经常会问到。
相关 大数据研发面试题总结
面试方向:大数据研发 Java部分 Java的集合类有哪些? ArrayList和LinkedList的区别 ArrayList的动态扩容是怎么实
相关 【大数据】——Hbase总结
一、前言 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Se
相关 大数据端口总结
常见端口汇总: Hadoop: 50070:HDFS WEB UI端口 8020 : 高可用的HDFS RPC端口 9000 :
相关 【大数据】——Redis总结
一、Redis简介 Redis是一种键值系统,可以用来缓存或存储数据。Redis是“Remote Dictionary Server”(远程字典服务)的缩写,
相关 大数据面试总结
1.Flink checkpoint 水印、window 背压 state 2.kafka 高写入、ack、zero-copy offset broker、to
还没有评论,来说两句吧...