植物基因组|注释版本问题|重测序vs泛基因组

生命组学:

细菌和其他物种比,容易发生基因漂移,duplication和重排。

泛基因组学研究的一般思路是通过comparison找到特殊基因区域orspecific gene,研究其调控机制(即通过一维发现特殊三维结构,再利用一维结构解释特殊结构的形成机制eg:基因保守与保守空间结构vs非保守空间结构,同时找两种不同结构的物理位置分布),并向应用上扩展。

重测序与泛基因组的差异在于,重测序是将新测得的genome与referencegenome比较,辨别其中的差异,而泛基因组是将同一个物种中不同亚种中通过n vs n得到gain loss,以此推断其演化情况。

 测序:

pacbio是三代测序,三代测序的错误主要是碱基数量错误,这样会移码导致基因判断错误,可以采用二代测序校正,现在最新的测序技术是纳米孔测序。

 注释:

注释版本不同造成genome basic information差异,因为原先存在测不出的sequence,或者判定为假基因的gene,或者错误的注释版本,总之与新做的实验数据在处理流程上有差异,为了缩小该差异造成的损失应该用自己的流程再跑一遍。

原先测序若低depth,则无法得到复杂结构信息。

有些原先测序得到的reference genome有部分无序列信息,所以对于新测得的genome参考价值低,所以选择合适的reference或者自己建立。

 突变常识:如果突变数量少则一般是SNP,数量多是基因重组。Indel常以3的倍数出现,影响比较小,其他数目会发生移码,影响大。

植物基因组的特点是有大量重复序列,杂合度高且染色体多倍化。

Conclusion:泛基因组学的内容是通过比较基因组学找到Core gene&dispensable geneshare gene&strain-specific gene,采用三种分类基因的角度对基因组学的重新分类,从而发现并解决生物学问题。eg发病机制,耐药性和环境适应性等。

原文地址:https://www.cnblogs.com/yuanjingnan/p/11538225.html