linux文件处理

取中间的行数作为train.txt

sed -n '1000000,170910580p' train.txt > trainv1.txt

   

取前面的行数作为dev.txt

head -1000000 train.txt > dev.txt

   

取后面的行数作为test.txt

tail -1000000 train.txt > test.txt

打乱文本中顺序

shuf filteredTop50Data.tsv -o shuffleFilteredTop50Data.tsv

原文地址:https://www.cnblogs.com/wuxiangli/p/10250758.html