组学干货

代谢组学数据质控“小法宝”,同款Tips你值得拥有

小A:欧耶!“我的样本送质谱检测平台测完了,数据也拿到了,写文章、发SCI指日可待!”

小B:唉!“我上周就拿到了,但是我对数据有点疑惑,不确定是样本问题还是检测问题,感觉跟我预期有点出入。”

小鹿:“别慌,小鹿有严格完善的质量控制体系来帮您!”

 

以上场景是否时常发生在大家的科研工作中呀?对于样品量比较多的代谢组学研究, LC-MS/GC-MS检测方法的难点问题之一就是随着检测时间的推移,监测系统会发生细微变化。

 

那这些变化是可控范围内的么?这些变化会导致样本检测出现较大偏差吗?如果有偏差需要怎么校准呢?

 

……正因为这些问题的存在,所以在代谢组学分析过程中,实验人员需要设定严格完善的质控体系,以保证数据的高质量。那么,今天小鹿就和大家聊一聊鹿明生物基于代谢组学前处理以及数据采集中数据质量控制的那些标准。
 

数据质控“小法宝”,同款Tips你值得拥有


代谢组学分析的样本数量往往比较大,为了确保数据的可靠性,代谢组学研究者提出了多种方法进行质控。包括内标的应用、检测混合物和QC样品等。小鹿从实验的前处理与上机两道重要抓手入手,着重聊一聊关于前处理质控以及上机质控的内容。
 

第一道门槛——样品称重、溶液移取质控

 

不要小瞧样品称重、溶液移取这一步,正所谓“好的开始是成功的一半”,这可是一个实验的开端。小鹿在最开始进实验室的时候,可是光练习标准化使用移液枪就整整练习了一天呢!那么,如何才能把握好这一步质控呢?这就要求称量同一实验样本或者移取试剂时的RSD不超过5%。这样做的好处是能保持操作一致性,以及不同批次间的重复性。
 

划重点——混样质控(QC样本)


近年来逐渐有一种趋势:越来越多的科研杂志要求作者提供相关的QC操作流程、呈现质控数据等。

 

了解到大家的需求,小鹿在这边汇总下QC质控是如何操作的。首先,需要准备一份QC样本。

要求:

➷1)它可以是混合相同体积的所有待检测样本,然后按照与待测样本相同的前处理方法来处理QC样本,之后进样进行质谱分析;

➷2)也可以用所有提取好的样本中取等量混合作为QC;

➷3)或者用标准品混合液作为QC样本。

数据质控“小法宝”,同款Tips你值得拥有

(图片来源:David B. et al., 2018, Metabolomics)

 

标准品混合液由商业标准品混合制备,通过检测已知的代谢混合物,快速评估仪器检测结果质量(评估内容包括RT稳定性、峰型、检测器的响应、和检测器的灵敏度)。标准品混合液测定的数据可用于快速评判仪器的参数设置是否适合待测样品,并且能够检测样品测定过程中仪器响应是否有较大的变化。

 

QC样品检测能够提供数据重复性的评价标准
 

对于一组样本数量较少的样品而言:QC样品是所有样品的混合物,通过所有待测样品的等量混合来制备,能够代表所有的样品。

对于样品数量较多的实验:如流行病学或多大型多医学中心联合临床研究,需要检测的样本数量达到上千个、样本制备历时多个月,待测样品中的代表性样品可用来制备不同批次的QC样品,该QC样本等量分装后冷冻保存,避免反复冻融。

 

说了这么多,那么QC质控在具体实验中是如何操作的呢?

通常我们是混合相同体积的所有待检测样本,然后按照与待测样本相同的前处理方法来处理QC样本,之后进样和上机检测。样本检测时,通常在最开始运行5-10个QC样本,之后根据样本数量的多少在几个检测样本之间插入一次QC样本。

数据质控“小法宝”,同款Tips你值得拥有

(图片来源:Want E.J. et al., 2010, Nature protocols.)

 

敲黑板— —内标质控法

 

除了QC质控法以外,内标的质控法也是代谢组学检测过程中一个重要的方法。在实验中针对一类化合物的检测加入一个或多个内标,内标与待检测化合物的结构相似或者化学性质相近,内标的RSD不能超过30%。内标法的优点是可以通过上机阶段内标物质的信号响应来反映代谢前处理/提取阶段的重复性。关于内标的选取原则以及内标类型,小鹿与大家分享一些经验:

 

➷内标选取原则:

1、与待测化合物性质相似;

2、样本中不存在该化合物,非内源性物质;

3、不与样本中的代谢物发生反应;

4、内标的添加量接近样本中被测组分的量。

 

➷内标类型:

1、同位素内标;

2、同系物、与目标化合物结构类似的物质;

3、色谱保留时间相近的。

数据质控“小法宝”,同款Tips你值得拥有

 

生物学重复— —随机样本重复性质控
 

代谢组学分析一般建议6~8个生物学重复。其目的:

➷一是为了保证数据的可靠性(样本数量过少,会导致后续多元统计分析模型过拟合,统计结果不可信)。

➷另一方面也是作为严格质控流程中的一环,通过上机阶段所有物质的信号响应来反映样本前处理/提取阶段的重复性。一般认为3个重复样本的RSD不超过30%,则认为该数据可靠。

 

进样顺序大有讲究

不同的QC样本类型,可以用来判断仪器状态、柱子干净程度、流程稳定性、干扰情况、系统偏差、响应变化等,所以在进样顺序上也大有讲究。针对不同检测目的,进样顺序也会不同,目前较为普遍适用的进样顺序如下图所示:

 

①非靶向代谢组检测分析:

数据质控“小法宝”,同款Tips你值得拥有

② 精准靶向代谢组检测分析

数据质控“小法宝”,同款Tips你值得拥有

实际操作中,针对不同的样品类型、基质复杂情况以及检测目的,也会有细微的调整。小鹿结合目前常用的进样顺序以及文献发表的进样顺序,进行了优化调整,也是目前我司常用的进样顺序:

数据质控“小法宝”,同款Tips你值得拥有

图1 | GC-MS/LC-MS非靶向代谢组学

数据质控“小法宝”,同款Tips你值得拥有

图2 | GC-MS/LC-MS精准靶向代谢组学

 

QC混样的数据评估——数据可靠的有力保障

 

QC样本在样本检测前用于平衡“色谱-质谱”系统,在样本检测过程中用于评价质谱系统的稳定性。QC样品的分析步骤可分为:QC样本的RSD筛选;QC样本TIC叠加图;QC样本主成分分析;对QC代谢物强度分布进行评估;以及QC样本层次聚类。

 

QC样本的RSD筛选

删除QC组RSD>40%的离子峰。相对标准偏差(Relative standard deviation,RSD)是标准偏差与测量结果算术平均值的比值,是一种量度数据分布的分散程度的标准,用以衡量数据值偏离算术平均值的程度。标准偏差越小,这些值偏离平均值就越少,反之亦然。

 

如果是精准靶向代谢组学分析的样本,还可以先将所有物质的QC按照响应(峰面积)进行作图(如下图),更直观地观察到QC在整个项目过程中是否保持稳定,以更好地监控仪器工作稳定性。一般要求:QC混样对应物质峰的保留时间不超过0.1min及峰面积值RSD不超过40%。

数据质控“小法宝”,同款Tips你值得拥有

数据质控“小法宝”,同款Tips你值得拥有

图3 | 将所有物质的QC按照响应(峰面积)进行作图

 

QC样本TIC叠加图

将QC样本的总离子流图进行谱图重叠比较,如下图。结果表明各色谱峰的响应强度和保留时间基本重叠,说明在整个实验过程中仪器偏差引起的变异较小。

数据质控“小法宝”,同款Tips你值得拥有

图4 | TIC图叠加分析

 

QC样本主成分分析(PCA)

PCA分析是简单多元数据分析的初步方法,从概念上来讲,如果样品分析做得很好,PCA应该显示第一个平衡系统QC样品对之后系统平衡QC样品的追踪现象。下图显示了一个基于LC-MS的非靶向代谢组学项目的PCA得分图,图中最开始的QC样品用红色标识出来。图中可以看到前3个系统平衡阶段的QC样品对系统平衡后QC样品的追踪现象。而系统平衡后QC样本紧密聚集在一起表明,数据值得进一步的分析。

数据质控“小法宝”,同款Tips你值得拥有

(图片来源:Want E J, Wilson I D, Gika H, et al. Global metabolic profiling procedures for urine using UPLC–MS. Nature protocols, 2010, 5(6): 1005-1018.)

 

对QC代谢物强度分布进行评估

对QC样本的代谢物强度做Boxplot,如下图,其中Y坐标为质谱强度log10值,为保证箱线图可视化最多对60个样本进行绘制。

数据质控“小法宝”,同款Tips你值得拥有

QC样本层次聚类

为了更直观的展示QC样本与其他样本之间的关系及QC样本间的稳定性,我们对所有代谢物表达量进行层次聚类(Hierarchical Clustering),如下图所示。

数据质控“小法宝”,同款Tips你值得拥有


不可忽视的内标质控
 

对于实验过程中加入的内标进行质控,可以有效评价前处理过程和样本检测中质谱系统的稳定性,同时减少实验误差对于后续数据的影响。对实验过程中添加的L-2-XX丙氨酸(3,4-Dichlorophenylalanine)和11种脂肪酸甲酯内标进行人工定性检测确认:根据内标的离子碎片及其保留时间定性L-2-XX丙氨酸和11种脂肪酸甲酯内标。

 

对于定性得到的内标,进行RSD筛选。将所有样本中RSD>0.3的内标删除,保留RSD<0.3的内标,用于后续的数据预处理的分段归一化。

 

对L-2-XX丙氨酸和11种脂肪酸甲酯内标进行TIC的提取,如果代谢物检测总离子流图的曲线重叠性高,即不同时间段采集的技术重复样本保留时间和峰强度一致性好,表明质谱以及液相系统不同时间段的信号稳定性较好。如下图分别是不同样本的L-2-XX丙氨酸和11种脂肪酸甲酯内标的TIC叠加图:

数据质控“小法宝”,同款Tips你值得拥有

图5 | TIC图:L-2-XX丙氨酸

数据质控“小法宝”,同款Tips你值得拥有

图6 | TIC图:11种脂肪酸甲酯内标

 

做实验、写文章犹如闯关游戏,每一环节都可能暗藏陷阱。但如果能在实验及数据采集前做好质量控制方案,在写文章投稿之前对质控数据进行细致的整理,严格把关数据质量,那么在回复审稿人对数据可靠性及质量控制的疑问时,你是不是能更胸有成竹、有理有据呢?

 

QA/QC越严格,数据越可靠

 

关于实验室的质量管理体系,小鹿有一些些经验,可供大家参考:
 

➷非靶向代谢组的平台,针对GC-MS/LC-MS不同平台、不同类型的化合物进行了优化,以覆盖更多的代谢物;

➷对MS和UPLC进行严格管理、定期维护,包括定期更换进样针、衬管及隔垫、清洗离子源、检查泵压,以保证平台硬件的最佳状态;

➷前处理部分,进行多种内标质控,GC-MS的前处理以及衍生化环节、LC-MS的提取及挥干复溶环节均有不同的内标进行质控,以确保前处理的稳定;

➷建立完善的QA/QC质控体系;

➷细致的数据处理环节和人工核验流程;每一个化合物的色谱峰,积分,MS1和MS2都经过二次确认,以确保数据的可靠性。

 

参考文献:

1.Want, E. J., I.D. Wilson, H. Gika, G. Theodoridis, R. S. Plumb, J. Shockcor, E. Holmes and J.K. Nicholson (2010). "Global metabolic profiling procedures for urineusing UPLC-MS." Nat Protoc5(6):1005-1018.

2.David Broadhurst1 · Royston Goodacre2 ·Guidelines and considerations for the use of system suitability and quality control samples in mass spectrometry assays applied in untargeted clinical metabolomic studies. Metabolomics (2018) 14:72.

 

猜你还想看
 

◆小鹿话代谢第一期:代谢组学——后基因组时代新热点

◆小鹿话代谢第二期:还在为实验发愁?看完这篇科研好文我被“种草”了

◆小鹿话代谢第三期:一看到导师就害怕?你也有“导师恐惧症”吗

◆小鹿话代谢第四期:看完秒懂,代谢组学医药领域机制研究实验设计方案怎么做?

◆小鹿话代谢第五期:标志物筛选、药效评价保姆级研究实验思路!了解一下~

◆小鹿话代谢第六期:Get农学领域——标志物筛选、机理研究的代谢组学实验设计方案!

◆小鹿话代谢第七期:代谢组学样本收集知多少~超全攻略让你轻松get!!!

◆小鹿话代谢第八期:组学研究“粪便君”样本如何收集?这里有高招哦~

 

 

END

文章来源于鹿明生物

上一篇:没有了下一篇:两篇连发~转录组学+蛋白质组学对水生生物中纳米塑料毒性机理研究