论文解读:
随着蛋白质组学和质谱的发展,后修饰蛋白质组的研究大量涌现。其中磷酸化、乙酰化等后修饰的分析技术已经十分成熟。而作为最复杂的蛋白后修饰之一,糖基化分析的技术挑战也是最大的【1,2】。与其他蛋白后修饰相比,糖基化不但会产生宏观不均一性(每个蛋白上可能有多个后修饰位点),更会产生海量的微观不均一性(每个位点上可能有几十甚至上百种不同的后修饰基团)。除此之外,糖链本身的离子化效率很低。这些因素的结合使得糖基化分析的通量和质量远低于蛋白质组学的常规分析水平【2,3】。
目前成熟的糖基化分析方法因技术的限制,通常只能分析不完整的后修饰信息,例如糖基化位点或者从蛋白上释放的糖链。在此类分析中,重要的蛋白-糖链连接信息被丢失【1-3】。完整的糖基化信息需要直接分析完整糖蛋白或完整糖肽(intact glycopeptide)。已有的完整糖肽分析技术存在以下问题:1)通量较低。由于解析完整糖肽需要获得肽段与糖链的信息,人们通常使用多种质谱碎裂技术或者多种实验技术的组合,从而限制了整体通量【3-5】;2)精度低,假阳性率很高。常规蛋白质鉴定的假阳性率在1%以下,而完整糖肽鉴定数据中的假阳性率甚至会高达20%【6】;3)缺乏质控标准。因为标准糖肽的合成非常困难,完整糖肽分析无法采用标准数据集进行质控评测,从而使得该领域的发展缓慢,数据质量层次不齐。
该研究开发了多种技术,解决了上述完整糖肽分析的三个问题。首先,研究人员广泛测试了目前最新质谱仪器支持的各种碎裂方式并进行了系统性分析、模拟,最后挑选了经过优化的阶梯能量HCD(higher-energy collisional dissociation)作为糖肽的质谱图采集方法。这种方法能够获得丰富的完整糖肽碎片信息,同时保证了数据采集效率。随后,研究人员开发了具有自主知识产权的完整糖肽检索引擎pGlyco2.0。pGlyco2.0能够充分利用阶梯能量HCD糖肽谱图种的碎片信息,并且在糖链、肽段和糖肽三个层面都进行质控,从而获得高质量的鉴定结果(下图)。作为对比,目前绝大多数完整糖肽检索引擎只对糖链或者肽段进行单方面的质控。
在此基础上,研究人员开发了基于重标技术的糖肽数据质控流程(下图),首次在复杂样品(酵母)中,客观地比较了不同检索引擎汇报糖肽结果的假阳性率:pGlyco2.0的假阳性率不到1%,而目前最常用的商用软件Byonic,其假阳性率在特定情况下高达20%。该质控流程为完整糖肽分析领域提供了全新的工具和标准,可以作为后续方法发展的评价指标之一。
糖肽数据质控流程示意图
?
最后,研究人员使用pGlyco2.0整套流程,在小鼠五个脏器(心肝脑肺肾)中,鉴定了超过一万条非冗余糖肽,是目前最大的完整糖肽数据集。
值得一提的是,该工作是2016年发表在Scientific Reports杂志上的相关研究的一个较大的延伸(下图)。2016年该研究团队就首次报道了一款解析完整 N-糖肽质谱数据的软件——pGlyco。该软件利用了质谱采集数据的HCD (High Collsion dissociation)和CID(Collision-induced dissociation )碎片信息实现了糖肽的鉴定解析,填补了目前完整N-糖肽鉴定方法中缺少false discovery rate (FDR)分析、糖肽鉴定方法中缺少充足碎片信息的空缺,挑战了糖蛋白组学分析中最困难的方面,解决了目前N-糖肽鉴定中FDR高等问题,达到对蛋白糖基化微异质性的可靠表征。
据悉,该论文的共同第一作者有五位,分别为复旦大学生物医学研究院博后刘铭琪,北京中科院计算所助理研究员曾文锋,复旦大学生物医学研究院博士方盼,博后曹纬倩,中科院北京计算技术研究所助理研究员刘超。复旦大学生物医学研究院杨芃原教授,中科院北京计算技术研究所贺思敏研究员,上海蛋白质中心黄超兰研究员为共同通讯作者。复旦大学生物医学研究院为第一完成单位。该项目得到国家重点研发计划,国家重大仪器专项,973和863计划的支持。
参考文献:
1. Alley, W. R. Jr. Mann, B. F. & Novotny, M. V. High-sensitivity analytical approaches for the structural characterization of glycoproteins. Chem. Rev. 113, 2668–2732 (2013).
2. Dallas, D. C., Martin, W. F., Hua, S. & German, J. B. Automated glycopeptide analysis--review of current state and future directions. Brief. Bioinform. 14, 361–374 (2013).
3. Desaire, H. Glycopeptide analysis, recent developments and applications. Mol. Cell. Proteomics 12, 893–901 (2013).
4. Hu, H., Khatri, K. & Zaia, J. Algorithms and design strategies towards automated glycoproteomics analysis. Mass. Spectrom. Rev. 36, 475–498 (2016).
5. Dodds, E. D. Gas-phase dissociation of glycosylated peptide ions. Mass. Spectrom. Rev. 31, 666–682 (2012).
6. Wu, S. W., Pu, T. H., Viner, R. & Khoo, K. H. Novel LC-MS(2) product dependent parallel data acquisition function and data analysis workflow for sequencing and identification of intact glycopeptides. Anal. Chem. 86, 5478–5486 (2014).