alpha rarefaction using qiime

shannon菌群多样性指数

H=-∑(Pi)(㏑Pi)

Pi=样品中属于第i种的个体的比例,如样品总个体数为N,第i种个体数为ni,则Pi=ni/N;

各种之间,个体分配越均匀,H值就越大。如果每一个体都属于不同的种,多样性指数就最大;如果每一个体都属于同一种,则其多样性指数就最小

Dominance:随即取两条序列,来自同一个样品的概率Σ (Si(Si-1))/N(N-1);

simpson 菌群多样性指数

         随机取样的两个个体属于不同种的概率=1-随机取样的两个个体属于同种的概率;越均匀,值越大

PD_whole_tree谱系多样性:

谱系alpha多样性(phylogenetic diversity,Faith 1992):探讨进化历史的保存,应用于种群,群落,生物地理学,保护生物学。

谱系beta多样性(phylobetadiversity,Webb 2002):探讨群落或的确的谱系距离及其成因。

谱系信号与谱系结构(phylogenetic signal and phylogenetic structure):探讨群落和地区物种共存机制。

谱系多样性(phylogenetic diversity PD),某个地点所有物种间最短进化分支长度之和占各节点分支长度综合的比例(Faith,1992)

群落谱系距离(phylogenetic distance):群落I与群落II中种俩俩之间谱系分支长度之和的平均值(Webb,2002)

chao1 菌种丰富度指数

Schao1=Sobs+n1(n1-1)/2(n2+1),其中Schao1为估计的OUT数,Sobs为观测到的OTU数,n1为只有一天序列的OUT数目,n2为只有两天序列的OUT数目。

observed_species Otu的个数

goods_coverage  测序深度指数

测序深度:C=1-n1/N,n1为只有含一条序列的OTU数目,N为抽样中出现的总的序列数目。

使用Qiime计算

16s构建进化树:

align_seq.py: http://qiime.org/scripts/align_seqs.html

align_seqs.py -i $PWD/unaligned.fna -t $PWD/core_set_aligned.fasta.imputed -o $PWD/pynast_aligned_defaults/

filter_alignment.py: http://qiime.org/scripts/filter_alignment.html

filter_alignment.py -i seqs_rep_set_aligned.fasta -m lanemask_in_1s_and_0s -o filtered_alignment/

make_phylogeny.py:http://qiime.org/scripts/make_phylogeny.html

make_phylogeny.py -i $PWD/aligned.fasta -o $PWD/rep_phylo.tre

计算alpha稀释曲线:

alpha_rarefaction.py

http://qiime.org/scripts/alpha_rarefaction.html

alpha_rarefaction.py -i otu_table.biom -o arare_max100/ -t rep_set.tre -m Fasting_Map.txt -e 100

-e指深度,和beta多样性中的-e参数一样

--metrics shannon,PD_whole_tree,chao1,observed_species,goods_coverage,simpson

指定需要计算的类型

参考:http://blog.sina.com.cn/s/blog_670445240102uw6s.html

原文地址:https://www.cnblogs.com/lyon2014/p/4030522.html