hadoop教程

目录

前言

1、Hadoop 简介

2、Hadoop HDFS

2.1、HDFS 写入文件

2.2、HDFS 读文件,可靠性以及命令工具

3、hadoop YARN

3.1、ResourceManager

3.2、YARN NodeManager

3.3、YARN ApplicationMaster

3.4、YARN Container

3.5、YARN Failover失败处理

4、MapReduce

4.1:MapReduce 读取数据

4.2:MapReduce Mapper

4.2:MapReduce Shuffle

第 5 章 Hadoop IO

第 6 章测试

第 7 章安装

第 8 章配置

第 9 章监控

本文档使用 V型知识库发布

Hadoop - 简介

2017年07月22日 13:30 | 2601次浏览

Hadoop可运行于一般的商用服务器上，具有高容错、高可靠性、高扩展性等特点

特别适合写一次，读多次的场景

适合

1.大规模数据

2.流式数据（写一次，读多次）

3.商用硬件（一般硬件）

不适合

1.低延时的数据访问

2.大量的小文件

3.频繁修改文件（基本就是写1次）

Hadoop架构

1. HDFS: 分布式文件存储

2. YARN: 分布式资源管理

3. MapReduce: 分布式计算

4. Others: 利用YARN的资源管理功能实现其他的数据处理方式

内部各个节点基本都是采用Master-Woker架构

小说《我是全球混乱的源头》

感觉本站内容不错，读后有收获？小额赞助,鼓励网站分享出更好的教程

上一篇：hadoop教程:前言下一篇：python hashlib

^