NCBI之gene系列

1、基因系列中的data索引

2、基因ID之间的转换

对于生信,依托于别人的工具不如自己动手,由于研究发表的滞后性,往往很多工具提供的转换并不是最新的,况且开发者水平也参差不齐,理解原理才能让你来去自如。

今天主要记录几个ID转换的方式:

以果蝇为例

详细的了解阅读下面:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/README

1、从NCBI下载基因ID信息:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/GENE_INFO/Invertebrates/Drosophila_melanogaster.gene_info.gz

从中可以看到很详细的各种基因信息

2、从NCBI下载基因与其他ID转换的信息:

一、转refseq:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2refseq.gz

二、转ENSG:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2ensembl.gz#TCGA小工具ENSG转换由此而来

三、转uniprot:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2accession.gz

四、转unigene:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2unigene

五、基因与GO的对应关系:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2go.gz

3、使用ID_Mapping:http://www.uniprot.org/uploadlists/

4、提取lncRNA的看这里:https://www.shengxin.ren/question/23

以上是数据原始信息,可以根据以上信息提取整理,应付各种常见的基因ID转换基本没啥问题了

原文地址:https://www.cnblogs.com/djx571/p/10263640.html