SnpHub搭建 | 数据处理中可能出现的问题

1. VCF文件中出现了position顺序不对(未排好序)

使用bcftools sort进行排序

bcftools sort xxx.vcf -Oz -o xxx.sorted.vcf.gz

2. bcftools在写文件时,因为contig未出现在header中而报错

使用bcftools reheader-f参数,将参照基因组fasta的fai索引文件中的contig信息加入vcf的header中。

bcftools reheader -f ref.fasta.fai xxx.vcf.gz  -o xxx.reheadered.vcf.gz

-f参数似乎是较新版本的bcftools才加入的参数,在1.8版本的bcftools上提示无此参数,而1.10版本可以使用。

也可以手动编辑文件头,并将新文件头替换至vcf

bcftools view xxx.vcf.gz -h > header.txt

vi header.txt

bcftools reheader -h header.txt xxx.vcf.gz -o xxx.reheader.vcf.gz
原文地址:https://www.cnblogs.com/esctrionsit/p/13415117.html