97每日博客

今天了解学下下HDFS的读数据流程:

(1)客户端通过 DistributedFileSystem 向 NameNode 请求下载文件,NameNode 通过查
询元数据,找到文件块所在的 DataNode 地址。
(2)挑选一台 DataNode(就近原则,然后随机)服务器,请求读取数据。
(3)DataNode 开始传输数据给客户端(从磁盘里面读取数据输入流,以 Packet 为单位
来做校验)。
(4)客户端以 Packet 为单位接收,先在本地缓存,然后写入目标文件。

原文地址:https://www.cnblogs.com/ruangongwangxiansheng/p/14161505.html