MetaPhlAn 2:宏基因组进化分析

描述

MetaPhlAn是分析从物种水平分辨率宏基因组鸟枪法测序数据的微生物群落(细菌,古细菌,真核细胞和病毒)的组成的计算工具。从版本2.0,MetaPhlAn还能够确定具体的菌株(在将样品含有先前测序的菌株的不那么频繁的情况下),并跟踪跨越样品菌株的所有物种。

MetaPhlAn 2依靠〜1M唯一的特定分支,标记基因(标记信息文件可以在SRC / utils的/ markers_info.txt.bz2或在这里找到)从〜17000的参考基因组鉴定(〜13500细菌和古细菌,3500〜病毒,和〜110真核),使得:

  • 明确的分类任务;
  • 有机体相对丰度的准确估计;
  • 对于细菌,古细菌,真核生物和病毒种级别分辨率;
  • 菌种鉴定和跟踪
  • 幅度的加速比的订单相比现有的方法。
  • 宏基因组应变水平的人口基因组学

先决条件

MetaPhlAn需要Python 2.7版或更高argparse,临时文件和numpy的安装库(除了为numpy的,他们通常与蟒蛇分布一起安装)。现在还支持Python3。

如果提供的SAM输出BowTie2作为输入,没有额外的前提条件。

  • 如果您想使用BowTie2集成在MetaPhlAn,你需要有BowTie2版本2.0.0或更高版本和Perl安装(bowtie2需要在与执行系统路径读权限)

  • 如果使用“utils的/ metaphlan_hclust_heatmap.py”的剧本绘制和聚类多MetaPhlAn异形样本,还需要以下Python库:matplotlibSciPy的pylab(如果不与MatPlotLib一起安装)。

  • 如果要产生输出为“BIOM”文件,你还需要BIOM安装

  • MetaPhlAn不紧密地与先进的热图密谋整合hclust2和进化树可视化GraPhlAn如果使用这样的可视化工具,请参考他们的先决条件。

安装: clone https://bitbucket.org/biobakery/metaphlan2

基本用法:

 ========== MetaPhlAn 2 分支- 估计 =================

==========  MetaPhlAn  2   跟踪 ============================ 
 INPUT_FILE              输入 文件 可以 
                        *  一个 FASTQ  文件 包含 宏基因组 读取
                        
                        *  一个 BowTie2  产生的 SAM  文件 
                        OR 
                        *  一个 中介 映射 文件   宏基因组 产生  一个 先前 MetaPhlAn  运行 
                        如果  输入 文件  丢失  脚本 假定   输入  提供 使用  标准 
                        输入  命名 管道
                        重要提示  类型  输入 需要   指定  - INPUT_TYPE 
  OUTPUT_FILE             选项卡- 分隔 输出 文件   预测 分类群 的相对 丰度 
                        [ stdout中 ,如果  存在]

必需的 参数
  - mpa_pkl  MPA_PKL       元数据 腌制 MetaPhlAn  文件
  - INPUT_TYPE  { FASTQ FASTA multifasta multifastq bowtie2out SAM } 
                        设置 是否  输入   multifasta  文件  宏基因组 读取  
                         SAM  文件   映射   读取 反对  MetaPhlAn  分贝
                        [ 默认的 自动 Ë   脚本  尝试  猜测  输入 格式]
 

 

原文地址:https://www.cnblogs.com/ylHe/p/6072717.html