利用USearch去除嵌合体(chimeras)

嵌合体序列指在pcr过程中,两条不同的序列产生杂交扩增的序列,属于人工污染,在ITS和16S分析中,应该首先去除,USearch提供去除嵌合体的功能

usearch -uchime_ref reads.fna -db reference.fna -strand plus -nonchimeras nonchimeras.fna

usearch 链接:http://drive5.com/usearch/manual/uparse_cmds.html

同时usearch提供更加可靠的聚类方案(未详考),聚类流程:

1  usearch -derep_fulllength nonchimeras.fna -output derep.fa -sizeout

计算reads丰度(完全一样的reads数量)

2  usearch -sortbysize derep.fa -output sorted.fa -minsize 2

按照reads丰度排序,并且去除丰度为1的reads

3  usearch -cluster_otus sorted.fa -otus otus1.fa

聚类

4  python  fasta_number.py otus1.fa OTU_ > otus.fa

OTU命名

5  usearch -usearch_global nochimeras.fa  -db otus.fa  -strand plus -id 0.97 -uc map.uc

制作uc文件

6  根据uc文件制作 otu.table

原文地址:https://www.cnblogs.com/lyon2014/p/4048353.html