NGSQC toolkit

一、NGSQCTooklit 使用

主要是去除dapter和低质量的碱基,并有统计结果

   可以得到如下的结果

1,每个位置的碱基的平均质量

2,每个GC值对应的reads数

3,每个质量值对应的reads数

4,每个位置对应的碱基个数

5,每个位置对应的输入碱基位置和质检后的碱基个数

6,对质量的总结。

QC文件夹中包含了4支PERL程序,用于454 READS或ILLUMINA READS的QC,分别为:

IlluQC.pl 用于Illumina reads的QC。默认情况下去除掉含有primer/adaptor的reads和低质量的reads,并给出统计结果和6种图形结果。默认设置 (‘-s’ 参数) 碱基质量低于20的为低质量碱基;默认设置 ( ‘-l’ 参数)低质量碱基在reads中比例 >30% 的为低质量reads。程序运行例子:

$ perl $NGSQCHome/QC/IlluQC_PRLL.pl -pe r1.fq r2.fq 2 5 -p 8 -l 70 -s 20

IlluQC_PRLL.pl 和上一个程序没有多大区别,只是多了 ‘-c’ 参数来进行并行计算,增加程序速度。

454QC.pl 对454 reads进行QC。
454QC_PRLL.pl 和上一个程序一眼个,只是多了 ‘-c’ 参数来进行并行计算,增加程序速度。
454QC_PE.pl 对paired-end测序的454 reads进行QC。

-pe 双端测序例:

-se 单端测序例:

-s 碱基质量低于20(默认设置)的为低质量碱基

-l 低质量碱基在reads中比例>30%(默认设置)的为低质量reads

-p 要使用的进程数量

-t 统计输出格式

-o 指定输出文件名或者是路径

-z 输出过滤后的高质量reads

同参数

-c 使用多个处理器进行计算增加程序速度

原文地址:https://www.cnblogs.com/DaBing0806/p/4757518.html