制作适用于annovar的COSMIC数据库

转自:http://blog.sina.com.cn/s/blog_83f77c940102y76d.html

由于COSMIC数据库的原因,最后版本的annovar停更到v77版本,截止本文时间已经是V88版本。

annovar官方给出了更新方法,之前COSMIC只有编码区域的变异注释文件,现在又添加了非编码区,因此需要在构建注释文件的过程中需要四个文件,开发者可以从COSMIC数据库上自行下载。备注,COSMIC数据库注册的时候也可以商业邮箱,只不过在指定的时候你默认指定为学校或者科研机构也是可以骗过去的。

需要下载的四个文件分别是:
CosmicCodingMuts.vcf
CosmicMutantExport.tsv
CosmicNCV.tsv
CosmicNonCodingVariants.vcf

构建命令:
prepare_annovar_user.pl -dbtype cosmic CosmicMutantExport.tsv -vcf CosmicCodingMuts.vcf > hg38_cosmic76.txt
prepare_annovar_user.pl -dbtype cosmic CosmicMutantExport.tsv -vcf CosmicNonCodingVariants.vcf >> hg38_cosmic76.txt

建议构建index,因为COSMIC文件越来越大。但是官方没有提供index文件,可以在annovar官网上留言直接找作者要就可以了。作者回复很快,大约三天时间。

原文地址:https://www.cnblogs.com/yuwq/p/11534885.html