snakemake学习笔记

什么是snakemake?

snakemake 是一个流程搭建的工具,这里主要用来记录一些snakemake的使用方法

  • 对于run或者shell部分的需要使用sample变量可以使用wildcards.sample来获取
  • 对于写好的模块可以使用include来载入,然后使用rule all定义所有的输出,这样运行一个总的模块就可以直接开启整个流程
rule all
    expand()

include:Filter.snakemake.py
  • 指定一个config文件可以使用--configfile 参数来进行传入
  • 如果只控制运行某一个rule,可以加上参数--forcerun rulex
  • 做出流程图
snakemake --dag -s RNAseq.snakemake.py --configfile test.yaml |dot -Tpdf > dag.pdf
snakemake --dag -s RNAseq.snakemake.py --configfile test.yaml |dot -Tsvg > dag.svg
  • rule 流程图
snakemake --rulegraph -s RNAseq.snakemake.py --configfile test.yaml |dot -Tpdf > rule.pdf
  • 强制去重新运行一遍rule
snakemake -s RNAseq.snakemake.py --configfile test.yaml --forcerun filter_stat
  • 指定运行的cpu数,使用-j参数
  • 只打印不运行使用-n参数
  • 在使用一个总的模块来将所有的模块串起来的过程中,rule all声明只能写在这个总的模块里面

  • 如下报错的原因是因为rule all里面的输出在其他的子rule里面没有做为输出
    http://vipkshttp0.wiz.cn/ks/share/resources/5caf615e-4bee-45f1-a60e-acb0883bde2d/35f4832b-c5d4-4be7-833b-39d57b621f8c/index_files/6e57199a-ce72-4390-bd32-57e1855b7ad3.png

使用snakemake投递任务时

snakemake --cluster 'qsub -l vf=15G,num_proc=12 -cwd -q st.q -P P18Z10200N0170 -binding linear:12' --configfile test.yaml --snakefile Denovo.stLFR.snakemake.py --jobs 6
  • --jobs 能设置并行投递的任务

  • 投递的命令需要加引号

  • 当投递到集群,杀掉snakemake进程时,任务也会杀掉,而wdl是不会出现这种情况的

  • shell里面的命令{}需要用{{}}的方式来写,与python有点类似

原文地址:https://www.cnblogs.com/raisok/p/10970060.html