Flye 三代组装

Flye: 原始 PB / ONT reads 作为输入文件,输出 polished contigs文件

GenomeDataAsm.SizeNG50CPU timeRAM
Human CHM1 PB 100x 2.8 Gb 18.8 Mb 2700 h 676 Gb

CHM1 was run with --asm-overage 40

Flye使用重复图作为核心数据结构。与de Bruijn图(需要精确的k-mer匹配)不同,重复图的边表示基因组序列,节点定义了连接点。每个边分为独特的或重复的。基因组以未知方式遍历图,因此每个唯一的边在遍历中恰好出现一次。重复图揭示了基因组的重复结构,这有助于重建最佳装配。

参考来源:

https://github.com/fenderglass/Flye

原文地址:https://www.cnblogs.com/bio-mary/p/11796627.html