seqkit | 序列处理利器 | fastq | fasta | barcode提取

有时候需要个性化处理原始序列,自己写python脚本太慢,且速度太慢,可以用seqkit这个工具,开发得不错。

比如提取10x genomics的barcode,fastq里的前16个碱基【搞错了,没这么简单】。

seqkit subseq Vcl-YFP-CNCC_3_S35_L004_R2_001.fastq.gz -r 1:16 > tmp.fastq

所有需要的信息都在这个bam文件里面,可以进行二次分析

possorted_genome_bam.bam BAM file containing both unaligned reads and reads aligned to the genome and transcriptome annotated with barcode information  

参考:

fasta/fq文件处理万能工具——Seqkit学习记录

Single-Library Analysis with cellranger count

原文地址:https://www.cnblogs.com/leezx/p/15421688.html