ITS简要分析流程(using Qiime)

Qiime安装

参考资料:http://blog.sina.com.cn/s/blog_83f77c940101h2rp.html

Qiime script官方说明http://qiime.org/scripts/index.html

一般ITS数据简要分析过程

reference下载:https://github.com/downloads/qiime/its-reference-otus/its_12_11_otus.tar.gz

其中97_* 和99_*分别是相似度97和99的reference

以下过程仅做参考,具体根据详细项目更改,

1   质控 

对数据进行质量控制,去除低质量数据

2   拼接

针对不同平台数据,采用相应的拼接软件拼接,根据contig长度,方差,N50(主要)等指标使用最佳k-mer值

3   pick_otus.py 

官方文档:http://qiime.org/scripts/pick_otus.html

从fasta文件中提取OTUs,提取方法可选,具体有cd-hit,blast,Mothur,usearch等等

具体使用方法:

python pick_otus.py -i seqs.fna -o picked_otus_default

-i参数指定输入序列,-o参数指定输出文件目录,输出文件为seqs_otus.txt和seqs_otus.log,-m可指定提取方法,更多具体参数说明参见官方文档

4   assign_taxonomy.py

官方文档:http://qiime.org/scripts/assign_taxonomy.html

使用下载的reference中的rep_set和 taxonomy文件夹中对应的文件,对序列分类,使用方法:

python assign_taxonomy.py –i seqs.fna -r <otus_dir>/rep_set/97_otus.fasta -t <otus_dir>/taxonomy/97_otu_taxonomy.txt

更多具体参数说明参见官方文档,输出文件示例:tax_assignments.txt

5   make_otu_table.py 

官方文档:http://qiime.org/scripts/make_otu_table.html

将提取出的seqs_otus.txt和分类文件tax_assignments.txt制作成out_table,即.biom文件

使用方法:

python make_otu_table.py -i otu_map.txt -t tax_assignments.txt -o otu_table.biom

6   pick_open_reference_otus.py

官方文档:http://qiime.org/scripts/pick_open_reference_otus.html

以上三个步骤可以通过Qiime中自带的pick_open_reference_otus.py流程完成,将需要使用到的参数写到文件params.txt中,并通过-p参数调用,param文件说明文档: http://qiime.org/documentation/qiime_parameters_files.html

7   summarize_taxa_through_plots.py

官方文档:http://qiime.org/scripts/summarize_taxa_through_plots.html

统计各个样品中的OUT中物种丰度信息,并从门纲目科属水平分别绘制物种丰度bar图

python summarize_taxa_through_plots.py -o taxa_summary -i otu_table.biom 在输出文件夹中,双击html文件即可观察bar图

8   alpha_rarefaction.py

官方文档:http://qiime.org/scripts/alpha_rarefaction.html

对拼接后的reads

使用示例:python alpha_rarefaction.py -i otu_table.biom -o arare/ -m map.txt,对reads进行随机抽样,得到的序列数和out数目比较,做出稀释曲线图,得到同样可以通过html文件查看

9   alpha_diversity.py

官方文档:http://qiime.org/scripts/alpha_diversity.html

使用示例:python alpha_diversity.py -i otu_table.biom -m chao1 -o adiv_chao1.txt,单样品多样性分析,绘制Alpha多样性bar图

10 统计.biom文件长度,并选取最短长度作为beta多样性的深度参数

可以借助ipython工具中提供的biom summarize-table方法,选取最短长度n,作为下一步骤中-e 参数(覆盖深度)

11 beta_diversity_through_plots.py

官方文档:http://qiime.org/scripts/beta_diversity_through_plots.html

该流程包含beta_diversity.py principal_coordinates.py make_prefs_file.py三个脚本,能够给出(un)weignted unifrac距离矩阵,并做出2D和3D的PCoA图形

使用示例:python beta_diversity_through_plots.py -i otu_table.biom -o bdiv_even100/ -m map.txt -e 100,使用-p参数指定距离范式

原文地址:https://www.cnblogs.com/lyon2014/p/3994483.html