Hadoop - 简介

2017年07月22日 13:30 | 2546次浏览

Hadoop可运行于一般的商用服务器上,具有高容错、高可靠性、高扩展性等特点

特别适合写一次,读多次的场景

适合

1.大规模数据

2.流式数据(写一次,读多次)

3.商用硬件(一般硬件)

不适合

1.低延时的数据访问

2.大量的小文件

3.频繁修改文件(基本就是写1次)


Hadoop架构

1. HDFS: 分布式文件存储

2. YARN: 分布式资源管理

3. MapReduce: 分布式计算

4. Others: 利用YARN的资源管理功能实现其他的数据处理方式

内部各个节点基本都是采用Master-Woker架构



小说《我是全球混乱的源头》

感觉本站内容不错,读后有收获?小额赞助,鼓励网站分享出更好的教程


上一篇:hadoop教程:前言 下一篇:python hashlib
^