一个文本处理的小练习:

1.有如下一组数据,经处理,希望得到每行60个碱基,每十个碱基一组。

1.将上述数据复制到编辑器,利用列模式,删除数字。保存为fa格式的文件

2.删除碱基间的空格并将小写变为大写:

seqkit seq  11.fa  -g -u  >  12.fa

3.指定每行输出的碱基数

seqkit  seq  12.fa  -s  -w  60  -o   13.fa

4.将每行60个碱基分为10个碱基一组,中间以空格隔开

5.然后就是在每行的行尾添加数字,暂时忘记咋做了。

原文地址:https://www.cnblogs.com/lmt921108/p/7577180.html