【MetDNA】基于代谢反应网络的大规模代谢物结构鉴定新算法

代谢是生命体内化学反应的总称,其所包含的代谢物变化规律可直接反映生命体的健康状态。非靶向代谢组学(untargeted metabolomics)可以在系统水平测量生命体内生理或病理状态下所有代谢物的含量变化,为研究其生物学机理提供依据。液相色谱-质谱联用(LC-MS)技术是代谢组学研究的主要工具之一。为了能够将采集的质谱数据信息转变为有效的生物学信息,首先就必须对代谢峰进行代谢物的结构鉴定。然而,到目前为止,在基于 LC-MS 的非靶向代谢组学中,大规模的代谢物结构鉴定仍然是一项非常具有挑战性的任务,也是代谢组学发展和应用的最大瓶颈之一。

目前最为广泛采用的代谢物结构鉴定策略是将二级质谱图(MS2谱图)与代谢物标准谱图库进行匹配进行代谢物鉴定。然而,此法严重受限于标准二级谱图的数目和覆盖度。目前标准二级质谱图库的扩充十分困难,因为小分子代谢物的标准MS2谱图必须通过采集代谢物标准品获取,但是目前大量代谢物没有标准品。此外,到目前为止还没有一个谱图库建立的标准流程,导致不同实验室和不同仪器采集的谱图互有差异。最近,也有研究者进行理论MS2谱图的预测,然而其精确度仍需提高。同时也有研究者开始利用代谢通路来进行代谢物的鉴定,如Mummichog和PIUMet。然而这些算法都基于差异代谢物富集在特定代谢通路或者代谢网络上的假设,只能鉴定差异表达的代谢特征峰,且准确度有待提高。

image

2019年4月3日,国际知名学术期刊《Nature Communications》杂志发表了由中国科学院上海有机化学研究所生物与化学交叉研究中心朱正江研究员课题组的最新研究成果Metabolic Reaction Network-based Recursive Metabolite Annotation for Untargeted Metabolomicshttps://www.nature.com/articles/s41467-019-09550-x)。在该论文中,研究人员开发了一种基于代谢反应网络的全新代谢物结构鉴定算法MetDNA(Metabolite identification and Dysregulated Network Analysis)。

在细胞代谢中,一个代谢物可以通过酶催化反应转变为另外一种代谢物。处在同一个代谢反应中且结构类似的两个代谢物可定义为一个反应对(reaction pair,RP)和反应对邻近代谢物(reaction-paired neighbor metabolite)。代谢物的二级质谱图依赖于其化学结构。因此,处于同一反应对的两个代谢物由于其类似的结构,其二级谱图也会有一定的相似性。基于该原理,MetDNA算法利用样本中已经鉴定出的代谢物作为种子,进一步鉴定其在代谢网络中邻近的代谢物。此原理可以迭代应用在新的鉴定出来的代谢物上,从而使MetDNA可以沿着代谢反应网络进行代谢物的循环鉴定和递归运算,直到不再能够鉴定出新的邻近代谢物,大大扩展了鉴定到的代谢物的数目。该算法的最大特点是可以通过代谢反应网络去鉴定没有标准MS/MS谱图的代谢物,使得代谢物的结构鉴定并不依赖很大规模的标准MS/MS数据库。例如,MetDNA方法可以利用20个种子代谢物即可完成>1000个邻近代谢物的注释,创新性地克服了代谢物标准MS/MS谱图库数目的限制。

image

研究人员使用MetDNA处理了多个数据集(涵盖5种物种、7种样品类型以及多种仪器平台),所有的数据集都能鉴定出来约2,000个代谢物的结构,证明了MetDNA是一个不依赖于平台且较为通用的代谢物结构鉴定算法和工具。为了方便研究人员使用MetDNA,朱正江研究员课题组开发了基于阿里巴巴云服务器的MetDNA网络软件平台http://metdna.zhulab.cn/)。MetDNA是一个基于网页版的软件,主页如图所示。用户需要注册登录才能使用。学术用途可以免费使用,商业用途需要联系朱正江研究员(jiangzhu@sioc.ac.cn)进行商业化授权。详细的使用方法可以查看MetDNA帮助文档http://metdna.zhulab.cn/metdna/help),另外,作者也提供了demo数据http://metdna.zhulab.cn/metdna/DemoDataset),供用户下载和测试。

image

MetDNA相关链接

原文地址:https://www.cnblogs.com/jessepeng/p/12732609.html