使用bioawk对基因组fasta序列ID(染色体/scaffold名称)排序?

需求

已知某基因组序列,染色体或scaffold ID顺序不定,想要对其按数字排序。
image.png
原顺序:
image.png

想要的排序结果:
image.png

实现

使用bioawk,没有的话conda直接安装。

bioawk -c fastx '{print}' old.genome.fa |  
  sort -k1,1V | awk '{print ">"$1;print $2}' >new.genome.fa

https://www.biostars.org/p/494201/

原文地址:https://www.cnblogs.com/jessepeng/p/14690875.html