seqkit | 序列处理利器 | fastq | fasta

seqkit | 序列处理利器 | fastq | fasta | barcode提取

有时候需要个性化处理原始序列，自己写python脚本太慢，且速度太慢，可以用seqkit这个工具，开发得不错。

比如提取10x genomics的barcode，fastq里的前16个碱基【搞错了，没这么简单】。

seqkit subseq Vcl-YFP-CNCC_3_S35_L004_R2_001.fastq.gz -r 1:16 > tmp.fastq

所有需要的信息都在这个bam文件里面，可以进行二次分析

possorted_genome_bam.bam BAM file containing both unaligned reads and reads aligned to the genome and transcriptome annotated with barcode information　　

参考：

fasta/fq文件处理万能工具——Seqkit学习记录

Single-Library Analysis with cellranger count