hadoop streaming key

sort –k1,2 把第一个第二个字段当成一个字符串排序

cat userstat_test_data.txt sessionquantize_test_data.txt | python SessionUserMap.py |  sort -k1,2

image

cat userstat_test_data.txt sessionquantize_test_data.txt | python SessionUserMap.py |   sort –k1 -k2

先按照第一个字段排序 再按照第二个字符串排序

image

原文地址:https://www.cnblogs.com/huiwq1990/p/3972373.html