spark学习中一些小问题---1

1.linux文件查找命令。这个很关键

find / -name employees.json

2.hdfs命令上传整个文件夹或文件

hadoop dfs -put /home/root/apache-hive-1.2.1-bin/lib/ /home/root/apache-hive-1.2.1-bin/

将lib整个文件夹包括文件夹下面的所有文件上传到hdfs对应的目录下。

3.Output directory hdfs://hadoop:8010/user/root/output already exists 问题解决

出现这个问题，啥也不用说，先把HDFS中的输出目录干掉：

hadoop fs -ls -R：可查看目录。
//显示文件夹，文件和文件夹内的所有内容
hadoop fs -ls 
//显示文件和文件夹

hadoop fs -rmr output:干掉输出文件。

MapReduce执行是不允许输出目录存在的，自动创建！

4.添加文件到hadoop集群中

hadoop fs -put employees.json /user/root/examples/src/main/resources/

5.细节方面