第一课:初识Hadoop

Hadoop核心组件之分布式文件系统HDFS:

特点:扩充性,容错性,海量数据存储。

在HDFS中每次上传文件,都会将文件切分成指定大小的数据块(默认128m)并以多副本的存储在多个机器上。

数据切分、多副本、容错等操作都是对用户透明的。

原文地址:https://www.cnblogs.com/XJJD/p/7676320.html