Hadoop学习笔记

1.Client上传文件流程
  a.Client先和namenode通信,判断上传文件的目录是否存在
  b.再将操作日志记录到edits文件中
  c.文件拷贝
  d.上传完毕后,同步到namenode的元数据

2.mapreduce读取半行数据如何处理:
  a.后一分片的半行数据给前一分片
  b.偏移量不为零,则丢弃
  c.如果没有读到 结尾符,会继续往后读

原文地址:https://www.cnblogs.com/yezl/p/8466132.html