生物安装软件信息

1.SNAP(可伸缩的核苷酸比对程序):https://github.com/chiulab/surpi  

     SNAP是一种快速、准确的短DNA比对器。它针对100个或更高的现代读取长度进行了优化,并利用这些读取通过基于哈希的索引方案快速对齐数据。

2.GenomeTools(gt 通用的开源基因组分析软件):http://genometools.org/index.html

3.fastq:https://github.com/brentp/bio-playground/tree/master/reads-utils

4.fqextract https://gist.github.com/drio/1168330

5.cutadapt (v1.2.1) https://code.google.com/p/cutadapt/

Cutadapt从高通量测序读取中发现并删除适配器序列、引物、poly-A tail和其他类型的不需要的序列。

以这种方式清理数据通常是必要的:从小rna测序中读取包含3 '测序适配器,因为读取的长度比已测序的分子长。扩增子读取从引物序列开始。聚a尾对从样本中提取RNA很有用,但通常你不希望它们出现在你的读数中。

Cutadapt通过以一种容错的方式找到适配器或引物序列来帮助完成这些修整任务。它还可以以各种方式修改和过滤读取。适配器序列可以包含IUPAC通配符。此外,还支持双端读取,甚至是colorspace数据。如果需要,还可以对输入数据进行多路复用,而不需要删除适配器序列。

Cutadapt附带了一个广泛的自动化测试套件,并且可以在MIT许可条款下使用。

6.prinseq-lite.pl http://prinseq.sourceforge.net

一种生物信息学工具,用于预处理和显示序列数据的信息。该工具是用Perl编写的,如果您希望过滤、重新格式化或修剪序列数据,那么它将非常有用。它还生成序列的基本统计信息。

7.fastQValidator http://genome.sph.umich.edu/wiki/FastQValidator

他使用fastQValidator验证fastq文件的格式。

FASTQ验证器的初始版本已经完成。它是使用LibStatGen: FASTQ构建的,FASTQ是LibStatGen库的一部分

8.Minimo (v1.6) http://sourceforge.net/projects/amos/files/amos/3.1.0/

一个模块化、开源的全基因组汇编器。开源,让每个人欢迎贡献和帮助建立优秀的装配工具,并模块化使新组件可以很容易地插入到现有组件中管道。这种模块化设计将促进新的装配算法的发展并允许AMOS项目不断发展和改进,以期最终实现这一目标成为被广泛接受和部署的组装基础设施。从这个意义上说,AMOS既是一种设计理念,又是一个软件系统。

9.Abyss (v1.3.5)http://www.bcgsc.ca/platform/bioinfo/software/abyss

Abyss是一个从头开始,并行,配对结束序列汇编器,是专为短期阅读。单处理器版本可用于组装高达100个碱基的基因组。并行版本使用MPI实现,能够装配更大的基因组。

10.RAPSearch (一个更快的RAPSearch,支持多线程) http://omics.informatics.indiana.edu/mg/RAPSearch2/

11.seqtk (v 1.0r31) https://github.com/lh3/seqtk

 

Seqtk是一个快速和轻量级的工具,用于处理FASTA或FASTQ格式的序列。它无缝地解析FASTA和FASTQ文件,这些文件也可以被gzip压缩。

 

 

 

 

 

 

原文地址:https://www.cnblogs.com/heguihui/p/10760533.html