发表评论取消回复
相关阅读
相关 走向云计算之Hadoop数据同步框架Sqoop
一、概述 Sqoop即SQL-to-Hadoop,是连接传统关系型数据库和Hadoop 的桥梁,用于把关系型数据库的数据导入到 Hadoop 系统 ( 如 HDFS HB
相关 走向云计算之数据收集系统Flume
一、概述 我们知道Hadoop提供了一个中央化的存储系统,有利于进行集中式的数据分析与数据共享,而且Hadoop对存储格式没有要求,比如可以存储用户访问日志、产品信息、网
相关 走向云计算之Hive基本架构和使用详解
一、概述 1、什么是Hive Hive是由facebook开源,最初用于解决海量结构化的日志数据统计问题的一种ETL(Extraction-Transformati
相关 走向云计算之Zookeeper简介和使用场景
一、概述 Zookeeper是一个针对大型分布式系统的可靠协调系统;提供的功能包括:配置维护、名字服务、分布式同步、组服务等;目标就是封装好复杂易出错的关键服务,将简单易
相关 走向云计算之HBase实际案例分析
一、概述 有时候了解软件产品的最好方法是看看它是怎么用的。它可以解决什么问题和这些解决方案如何适用于大型应用架构,能够告诉你很多。因为HBase有许多公开的产品部署,我们
相关 走向云计算之HBase的shell命令和JavaAPI详解
一、HBase的启动 由上一篇可知,HBase是建立在Hadoop HDFS之上的,因此在启动HBase之前要确保已经启动了Hadoop,启动Hadoop的命令是:`st
相关 走向云计算之MapReduce应用案例详解
一、概述 前面关于MapReduce的wordcount程序已经做了比较详细的分析,这里再给出MapReduce应用的几个小案例,来更加深入的理解MapReduce的设计
相关 走向云计算之MapReduce原理和运行流程详解
一、概述 MapReduce的设计理念源自于Google的MapReduce论文(发表于2004年12月),Hadoop MapReduce是Google MapRedu
相关 走向云计算之HDFS详解
一、概要 作为Hadoop的核心技术之一,HDFS(Hadoop Distributed File System,Hadoop分布式文件系统)是分布式计算中数据存储管理的
相关 走向云计算之工作流引擎Oozie
一、概述 目前计算框架和作业类型繁多:包括MapReduce Java、Streaming、HQL、Pig等,如何对这些框架和作业进行统一管理和调度是我们需要面临的一个问
还没有评论,来说两句吧...