各种测序平台对比

各种测序平台对比

  (2016-10-25 12:54:58)
  分类: 科技前沿
各种测序平台对比
 
 
Hiseq X ten与HiSeq2000对比
1. HiSeq2000测序的数据集,正常情况下会有一些开头和末尾第一个碱基为N的序列,每条lane会有数千至数万条这种序列,除第一个碱基外,后面碱基的Phred score都还比较高,而在我们的数据中,没有这一特征。
 
“第一个碱基为N”并非正常情况。只有特定版本的HCS软件,比如说v2.0.5,由于软件存在bug,才可能会出现第一或者倒数第一个碱基为N的序列。也就是说,这是软件运算的问题,测序没有问题,而且还不一定每次都出现。
 
进行2X100个循环的Paired-End测序,就测序2X101个循环。多出来一个循环是行业标准做法,也是Illumina官方建议的;
 
另外,“每条序列的前面几个碱基的质量评分很低”也不是一定的。如果文库的碱基复杂度高,簇密度又控制得好,则前面几个碱基的质量评分也可以达到比较高的数值。碱基质量,包括前几个碱基的质量评分高低,与文库构建的好坏有关,比如试剂的质量和操作水准;也与软件进行数据分析的参数估算有关,比如簇密度和碱基复杂度。
 
2. 用HiSeq2000测定模式生物基因组,然后将测序数据mapping回其本身的基因组,mapping率通常在75%~80%左右,有20~25%的序列是不能mapping回去的,而我们数据的mapping率达到了95%以上。
 
Illumina专家所指出的,mapping率高低与数据质量有关,也受比对方法、比对参数前后是否有差异、或者是否使用了不同版本的参考序列等因素影响。
原文地址:https://www.cnblogs.com/wangprince2017/p/9873534.html