代谢组学那些事儿,这些问题你有答案吗?

代谢处于基因、转录调控、蛋白网络的下游,相比其他水平的研究,代谢物的变化更接近表型。代谢组与其他组学相结合可以提高研究结果的说服力。从代谢组出发的贯穿组学,不仅可以研究现象,还可以研究发生原因。

上期代谢组学专题文章(代谢组入门科普~)向大家科普了什么是代谢组,并学习了大牛是如何做代谢组的。但了解了原理并非实验就能一帆风顺,于是本期专题主要罗列了一些大家咨询比较多的问题,快来看看有没有你不知道的。

01、如何选择代谢组检测平台?

目前代谢组主要有以下三种检测方法:液相色谱-质谱联用技术(LC-MS)、气相色谱-质谱联用技术(GC-MS)、核磁共振技术(NMR)。可以根据经费、物质性质、实验、样本类型、研究目的等方面,综合考量平台。

  • 由于代谢物种类多,浓度差异大,往往更适合使用高分辨率、高灵敏度、高通量的质谱检测平台。质谱平台的选择一般可根据检测代谢物的类型和理化性质,选择不同的电离模式和质量分析器,从最大限度的获取代谢物信息。而NMR平台由于灵敏度较低,鉴定的物质比较少,应用并不广泛。当然,目前任何一种平台都没法覆盖全部的代谢物。
  • 从经费角度来看,经费充足情况下,建议GC-MS和LC-MS都做,一般两种方法检测到的物质会有部分重合。GC-MS运行成本低于LC-MS。
  • 从物质鉴定数量角度来看,一般更建议使用LC-MS平台。在做非靶向代谢时,由于LC-MS前处理简单,无需衍生化处理,通常鉴定到物质种类数更多,应用更广泛。
  • 从重复性角度来看,GC-MS结果的重复性较差,衍生化处理将增加样品的不稳定性,导致重复性较差。
  • 从物质性质角度来看,待测的代谢物分子量比较小或者关注挥发性物质时,可以选择GC-MS平台。
  • 从样本类型角度来看,植物、土壤样品,可考虑用GC-MS,这与检测物质类型多为挥发性物质有关;液体或动物组织(包括人临床样品)多用LC-MC,一方面因为样品中的待测物质成分复杂,而LC-MS 适用性广,能全面覆盖到;另一方面LC-MS灵敏度高,能检测到更多物质。

02、非靶向代谢物定性定量原理是什么?

定性原理:主要根据样品打到的谱图和数据库谱图进行匹配,GC-MS综合保留时间、保留指数、谱图进行鉴定;LC-MS综合分子量、质荷比(m/z)、保留时间(RT)、谱图等信息进行代谢物鉴定。目前常见的GC-MS非靶数据库有NIST,GMD,weily、公司自建库等,常见的LC-MS非靶数据库有HMDB、 Metlin、MassBank、MzCloud、Lipidmaps、KEGG、CHEBI、公司自建库等。

定量原理:质谱检测获得的原始数据经过峰识别(peaksidentification)、峰过滤(peaks filtration)、峰对齐(peaks alignment)等处理,获得含质荷比(mass to chargeratio, m/z)、保留时间(retention time, rt)、峰面积(intensity)等信息的数据矩阵。峰面积是代谢物的质谱响应强度,表征代谢物的丰度。对峰面积进行归一化后,可用于后续差异代谢物筛选分析。

03、关注的目标代谢物在非靶标代谢组学检测中没有检测到是什么原因?

1)目前任何一种技术平台都无法检测到全部的代谢物质,可能目标代谢物以目前技术无法被检测到。

2)物质可能被检测到质谱峰,但是数据库中缺乏对应信息,无法定性。

3)非靶向代谢灵敏度相对较低,且该方法主要目的是尽可能多的鉴定物质。若是目标代谢物丰度较低,可能无法检出。

※ 综上,如有明确的目标代谢物,建议直接选择靶向代谢产品。

04、如果想检测的物质不在靶向检测列表中怎么办?

由于代谢物有数万种,并非所有物质都被检测过。另外,现有公共数据库或商业数据库中也不一定包含该物质的一级或者二级质谱图。因此,可以按照定制化产品进行评估,提供待检测的物质,并查找相应检测方法的文献,以此评估定制靶向产品的可行性。

但靶向产品的开发需要购买标准品,建立检测物质的方法学,再进行样本的检测,因此周期较长,成本也较高。

05、代谢组学研究的最大难点是什么?

代谢组学研究最大的难点是代谢物的鉴定,原因如下:

1)代谢物的鉴定主要是根据实际得到的谱图和数据库中的谱图进行比对,根据其匹配程度获得鉴定结果。因此,数据库中物质的覆盖范围很大程度影响了代谢组学研究的发展;

2)  同一个代谢物在不同仪器平台(如Waters/Thermo/AB平台等)上获得的图谱是不同的;同一个仪器平台上,不同分析条件下获得的图谱也不同;甚至不同浓度、不同时间下,同一个物质打出的图谱也会有所差别;不同的匹配算法导致的鉴定结果也不同。

因此,如果代谢物定性不准确,即使检测到再多物质,所获得的数据也是没有意义的。基于上述难点,可以从数据库可靠性、实验设计严谨性等角度加以改善:

1)    目前主流方法是根据二级谱图与数据库匹配来鉴定物质。由于公共数据库中二级谱图数据较少,且平台、参数设置等有差异,这增加了鉴定物质的难度。因此很多公司会自己购买标准品进行质谱分析获得谱图,同时整合公共数据库,这样获得数据库更加全面准确,以期尽可能多且准确的鉴定物质。

2)    需要一起分析的样本建议一批送测,同批次处理、上机、分析,平台及分析方法保持一致,以避免实验操作、仪器平台不同以及其他人为因素影响物质的鉴定。

06、代谢物种类繁多,为何只能鉴定到几百到上千个物质?

由于代谢物分子量小,结构复杂,只通过分子量和电荷数(一级质谱)鉴定不是很准确,因此更依赖标准品二级谱图数据库,但很多公共数据库(HMDB、Metlin等)中约有90%的已知代谢物都没有标准的二级谱图。即使有二级信息,由于代谢物的离子谱图可能由不同实验室的不同质谱仪器打出,仪器的种类、参数设置不同,都可能导致同一个代谢物产生的谱图存在偏差。因此代谢物虽然种类多数量多,但是鉴定到的物质相对较少。

07、在检测两种物质的丰度水平时,代谢组学获得的两种物质丰度比值关系和其他技术的检测结果明显相反,这是什么原因?

不同物质结构、携带的基团不同,质谱检测过程中,物质的离子化效率、对仪器信号的响应等方面可能存在较大差异,结果就呈现出不同物质的质谱检测效率不一致。因此,代谢组数据仅适用于不同组别间同一物质的比较,不适用于同一样本内部比较不同物质的差异。

08、代谢组检测阈值是多少,能检测到的最低含量是多少?

1)  不同检测平台的灵敏度不同,LC-MS灵敏度最高,可达到fM级。

2)  由于不同物质理化性质不同,其离子化效率、信号响应强度之间存在较大不同。因此物质是否能被检出也和其在样本中的丰度以及本身性质有关。对于代谢组来说,相同含量的不同物质,有的可以检出,有的未必能检测到。

09、代谢组检测过程中如何对样本或仪器进行质控?

检测前:代谢物提取处理之后,无法进行有效的定量。因此,为了得到理想的结果,建议按照要求提供足量样本量,后续通过控制投入一致的样本量,来确保结果的可靠性。在样本检测前,会对仪器进行调试与矫正,以保证仪器稳定工作。

检测中:样本数目较多时,为检测仪器稳定性,会在样本中间穿插多个QC样本(所有待测样本分别取少许混样,作为质控),并且及时清理仪器,最终以QC样本的一致性来判断仪器的稳定性。

10、代谢物提取通常采用什么方法?

通常使用有机溶剂萃取代谢物,再通过离心去除蛋白质等杂质。由于不同代谢物性质不同 ,可溶于水或不同的有机溶剂,因此针对不同的产品及不同类型代谢物,提取方法也不同。常用有机溶剂包括甲醇、氯仿、乙腈等。

11、想要检测植物中的黄酮类、花青素类这些次级代谢产物,如何选择产品?

可以选择有针对性的产品。可选方案:

1)黄酮类、花青素类靶向代谢产品。

2)除黄酮、花青素之外,还关注其他初级或者次级代谢产物,可选择针对植物的广泛靶向代谢。

3)可选常规非靶向代谢。检测到的一般为初级代谢产物,如氨基酸、游离脂肪酸、糖类等。而次级代谢产物是以初级代谢产物为前体来合成的,因此可以根据研究目的选择常规非靶代谢产品。

12、想要检测肽聚糖合成途径、能量代谢、糖代谢、脂质合成途径、脂类、氨基酸,如何选择产品?

可以选择有针对性的产品。可选方案:

1)能量代谢、糖类、脂肪酸类、氨基酸对应的靶向代谢产品。

2)可选常规非靶向代谢。这些物质均包括在非靶向数据库中。由于非靶向主要目的尽可能多的检测到物质,可能无法检测低丰度物质,所以即使数据库有这些物质的谱图,也不能保证样本中一定检测到。