【讲座】詹显全——Proteoforms在肿瘤中应用

Proteoforms/Protein species这个概念还是比较有意义的。

人类结构基因组测序接近尾声,人们就从结构基因组学研究转向功能基因组学研究,即对转录组和蛋白质组进行研究。1995年正式提出了”蛋白质组”和”蛋白质组学”的概念,距今已有25年历史了。

蛋白质组学的主要技术包括蛋白质组的分离技术鉴定技术蛋白质组信息学技术

蛋白质组的分离技术主要有双向凝胶电泳(2DE)多维液相色谱(2DLC)

蛋白质组的鉴定技术主要是基于质谱(MS)的技术,主要分为肽质指纹(PMF)串联质谱(MS/MS)分析技术,其用于蛋白质大分子分析的两大离子源主要有MALDIESI质谱技术发展很快,主要朝向高灵敏度和高通量方向发展。

蛋白质组信息学技术主要是用来构建蛋白质相互作用网络的相关技术。

蛋白质组的分离技术和质谱技术的不同联合就形成了各种类型的蛋白质组学分析技术:如2DE-MS和2DLC-MS。2DE-MS又有2DE-MALDI-PMF 和2DE-ESI-LC-MS/MS, 该技术在蛋白质组学研究的头10-15年是其主要技术,然而常规概念认为2DE的通量不高,即一个2D胶点中一般仅含有1-2个蛋白质,通常一次实验其通量仅能鉴定几十到一千个蛋白质,这样其在蛋白质组学中的地位逐渐被淡化。2DLC-MS主要有iTRAQ or TMT-based SCX-LC-MS/MS and label-free LC-LC-MS/MS, 这就是人们通常说的“Bottom-up”蛋白质组学,该技术在最近10-15年在蛋白质组学中起着核心技术的作用,因为其通量明显增加,一次实验其通量可达到几千到一万的蛋白质能被鉴定,但该方法鉴定的结果是一个protein group, 实质上鉴定的是编码蛋白质的基因,而并没有鉴定到真正意义上的蛋白质,即蛋白质存在形式(Proteoforms或Protein species)。

蛋白质存在形式(Proteoforms)是蛋白质组的基本单元。人类基因大约2万个,人类转录本至少10万个,每个转录本指导核糖体按三联密码子决定一个氨基酸残基来合成氨基酸序列,刚合成出来的蛋白质氨基酸序列是没有功能的,它必须到达其指定的位置如胞内、胞外,和不同的亚细胞器等,形成特定的三位空间结构,并与其周围的相关分子相互作用,形成一个复合物(complex)才能发挥其功能作用。从核糖体刚合成出来到其指定的位置过程中有很多的蛋白质翻译后修饰(PTMs; 据估计人体有400-600种PTMs)。这样,人类蛋白质组中的蛋白质存在形式(Proteoforms)至少有100万或甚至达10亿(图1)。

image

图1:Proteoforms的概念及形成模式(Zhan et al, Med One, 2018; Zhan et al., Proteomes, 2019)

如此庞大数量的Proteoforms/Protein species, 如何对其进行大规模的探测、鉴定和定量,是一个至关重要的事情。目前关于Proteoforms的研究有两套策略:一是“Top-down”MS技术,二是”Top-down”和“Bottom-up”相结合的技术即2DE-LC/MS技术(图2)。

image

图2:Proteoforms研究技术比较(Zhan et al., Med One, 2018; Zhan et al., Proteomes, 2019)

”Top-down”MS技术能探测、鉴定和定量Proteoforms,获得蛋白质的氨基酸序列和PTMs信息,然而该技术的通量较低,目前最大通量鉴定到5700个Proteoforms, 对应到860蛋白质。

最近,詹显全教授团队发现2DE-LC/MS技术是一超高通量的技术平台,在探测、鉴定和定量Proteoforms方面, 可以鉴定达几十万至上100万的Proteoforms。随着质谱灵敏度的显著提高,自2015年以来,詹显全教授团队就发现每个2D胶点包含了平均至少50个甚至达几百个Proteoforms,并且大多数是低丰度的;并在近1-2年来发表了相关论文来全面阐述2DE-LC/MS的新理念和实践,完全打破了40多年来人们对双向电泳的传统认识(即一个2D胶点中一般仅含有1-2蛋白质),为大规模的Proteoforms研究提供了技术基础。

Proteoforms/Protein species概念的发展极大的丰富了蛋白质组的内涵,是蛋白质组学研究的更高层次, 是国际科学发展的前沿,必将影响着整个生命科学和医学科学的研究和实践,有助于发现可靠而有效的疾病标志物,用于深度理解疾病分子机制和决定药物靶点,或者用于有效的预测、诊断、预后评估。

另外,蛋白质组是表型组的重要成分,是基因组功能的最终执行者,是基因组和转录组研究所不能替代的,要实现真正的个性化医学和精准医学,蛋白质组学研究是不能绕过去的。

原文地址:https://www.cnblogs.com/jessepeng/p/12732591.html