25、转录本(transcript)组成(gtf文件的第三列)

转录本(transcript)长度范围 32144823671498

3214482--3216021----3216022--3216024----3216025--3216968----3421702--3421901----3670552--3671348----3671346--3671348----3671349--3671498

           3UTR                       stop_codon                      CDS3         |      |           CDS2       |      |           CDS1                       start_codon                     5UTR 

                                                                                                      |      |                           |      |    

3214482------------------------------------------------------------3216968----3421702--3421901----3670552-----------------------------------------------------------3671498

                         exon3(3UTR,stop_codon, CDS3)                                    exon3(CDS2)                                      exon1(5UTR,stop_codon, CDS1)   

解释 transcript、UTR、stop_codon、exon、CDS、start_codon关系

CDS,是编码一段蛋白产物的序列。cds必定是一个orf。但也可能包括很多orf。反之,每个orf不一定都是cds。
开放阅读框(ORF)是基因序列的一部分,有内含子的,且包含一段可以编码蛋白的碱基序列。由于拥有特殊的起始密码子和直到可以从该段碱基序列产生合适大小蛋白才出现的终止密码子,该段碱基序列编码一个蛋白。OEF排除内含子就是CDS

原文地址:https://www.cnblogs.com/renping/p/7399698.html