BioArt按:糖基化是最復(fù)雜的蛋白后修飾之一,具有多種重要的生物學(xué)功能。與其他蛋白后修飾相比,糖基化更為復(fù)雜,分析難度很大。目前已有的糖基化分析方法有明顯的局限性:大部分方法僅能分析糖鏈或糖基化位點等不完整的糖基化信息,而基于糖肽的位點特異性分析方法則存在通量低,假陽性率高,數(shù)據(jù)質(zhì)量難以評測等問題。9月5日,復(fù)旦大學(xué)生物醫(yī)學(xué)研究院楊芃原課題組與中科院北京計算技術(shù)研究所賀思敏課題組以及上海蛋白質(zhì)中心黃超蘭課題組合作,在Nature Communications雜志上在線發(fā)表了題為“pGlyco 2.0 enables precision N-glycoproteomics with comprehensive quality control and one-step mass spectrometry for intact glycopeptide identification”的研究論文,該研究展示了高通量、高質(zhì)量的完整N糖肽分析流程。該研究為精準糖蛋白質(zhì)組分析提供了新的分析工具,并提供新的糖肽譜圖質(zhì)量評估方法以及目前最大的糖肽數(shù)據(jù)集。
論文解讀:
隨著蛋白質(zhì)組學(xué)和質(zhì)譜的發(fā)展,后修飾蛋白質(zhì)組的研究大量涌現(xiàn)。其中磷酸化、乙?;群笮揎椀姆治黾夹g(shù)已經(jīng)十分成熟。而作為最復(fù)雜的蛋白后修飾之一,糖基化分析的技術(shù)挑戰(zhàn)也是最大的【1,2】。與其他蛋白后修飾相比,糖基化不但會產(chǎn)生宏觀不均一性(每個蛋白上可能有多個后修飾位點),更會產(chǎn)生海量的微觀不均一性(每個位點上可能有幾十甚至上百種不同的后修飾基團)。除此之外,糖鏈本身的離子化效率很低。這些因素的結(jié)合使得糖基化分析的通量和質(zhì)量遠低于蛋白質(zhì)組學(xué)的常規(guī)分析水平【2,3】。
目前成熟的糖基化分析方法因技術(shù)的限制,通常只能分析不完整的后修飾信息,例如糖基化位點或者從蛋白上釋放的糖鏈。在此類分析中,重要的蛋白-糖鏈連接信息被丟失【1-3】。完整的糖基化信息需要直接分析完整糖蛋白或完整糖肽(intact glycopeptide)。
已有的完整糖肽分析技術(shù)存在以下問題:
1)通量較低。由于解析完整糖肽需要獲得肽段與糖鏈的信息,人們通常使用多種質(zhì)譜碎裂技術(shù)或者多種實驗技術(shù)的組合,從而限制了整體通量【3-5】;
2)精度低,假陽性率很高。常規(guī)蛋白質(zhì)鑒定的假陽性率在1%以下,而完整糖肽鑒定數(shù)據(jù)中的假陽性率甚至?xí)哌_20%【6】;
3)缺乏質(zhì)控標準。因為標準糖肽的合成非常困難,完整糖肽分析無法采用標準數(shù)據(jù)集進行質(zhì)控評測,從而使得該領(lǐng)域的發(fā)展緩慢,數(shù)據(jù)質(zhì)量層次不齊。
該研究開發(fā)了多種技術(shù),解決了上述完整糖肽分析的三個問題。首先,研究人員廣泛測試了目前最新質(zhì)譜儀器支持的各種碎裂方式并進行了系統(tǒng)性分析、模擬,最后挑選了經(jīng)過優(yōu)化的階梯能量HCD(higher-energy collisional dissociation)作為糖肽的質(zhì)譜圖采集方法。這種方法能夠獲得豐富的完整糖肽碎片信息,同時保證了數(shù)據(jù)采集效率。隨后,研究人員開發(fā)了具有自主知識產(chǎn)權(quán)的完整糖肽檢索引擎pGlyco2.0。
pGlyco2.0能夠充分利用階梯能量HCD糖肽譜圖種的碎片信息,并且在糖鏈、肽段和糖肽三個層面都進行質(zhì)控,從而獲得高質(zhì)量的鑒定結(jié)果(下圖)。作為對比,目前絕大多數(shù)完整糖肽檢索引擎只對糖鏈或者肽段進行單方面的質(zhì)控。
在此基礎(chǔ)上,研究人員開發(fā)了基于重標技術(shù)的糖肽數(shù)據(jù)質(zhì)控流程(下圖),首次在復(fù)雜樣品(酵母)中,客觀地比較了不同檢索引擎匯報糖肽結(jié)果的假陽性率:pGlyco2.0的假陽性率不到1%,而目前最常用的商用軟件Byonic,其假陽性率在特定情況下高達20%。該質(zhì)控流程為完整糖肽分析領(lǐng)域提供了全新的工具和標準,可以作為后續(xù)方法發(fā)展的評價指標之一。
糖肽數(shù)據(jù)質(zhì)控流程示意圖
最后,研究人員使用pGlyco2.0整套流程,在小鼠五個臟器(心肝腦肺腎)中,鑒定了超過一萬條非冗余糖肽,是目前最大的完整糖肽數(shù)據(jù)集。
值得一提的是,該工作是2016年發(fā)表在Scientific Reports雜志上的相關(guān)研究的一個較大的延伸(下圖)。2016年該研究團隊就首次報道了一款解析完整 N-糖肽質(zhì)譜數(shù)據(jù)的軟件——pGlyco。該軟件利用了質(zhì)譜采集數(shù)據(jù)的HCD (High Collsion dissociation)和CID(Collision-induced dissociation )碎片信息實現(xiàn)了糖肽的鑒定解析,填補了目前完整N-糖肽鑒定方法中缺少false discovery rate (FDR)分析、糖肽鑒定方法中缺少充足碎片信息的空缺,挑戰(zhàn)了糖蛋白組學(xué)分析中最困難的方面,解決了目前N-糖肽鑒定中FDR高等問題,達到對蛋白糖基化微異質(zhì)性的可靠表征。
據(jù)悉,該論文的共同第一作者有五位,分別為復(fù)旦大學(xué)生物醫(yī)學(xué)研究院博后劉銘琪,北京中科院計算所助理研究員曾文鋒,復(fù)旦大學(xué)生物醫(yī)學(xué)研究院博士方盼,博后曹緯倩,中科院北京計算技術(shù)研究所助理研究員劉超。復(fù)旦大學(xué)生物醫(yī)學(xué)研究院楊芃原教授,中科院北京計算技術(shù)研究所賀思敏研究員,上海蛋白質(zhì)中心黃超蘭研究員為共同通訊作者。復(fù)旦大學(xué)生物醫(yī)學(xué)研究院為第一完成單位。該項目得到國家重點研發(fā)計劃,國家重大儀器專項,973和863計劃的支持。
參考文獻:
1. Alley, W. R. Jr. Mann, B. F. & Novotny, M. V. High-sensitivity analytical approaches for the structural characterization of glycoproteins. Chem. Rev. 113, 2668–2732 (2013).
2. Dallas, D. C., Martin, W. F., Hua, S. & German, J. B. Automated glycopeptide analysis--review of current state and future directions. Brief. Bioinform. 14, 361–374 (2013).
3. Desaire, H. Glycopeptide analysis, recent developments and applications. Mol. Cell. Proteomics 12, 893–901 (2013).
4. Hu, H., Khatri, K. & Zaia, J. Algorithms and design strategies towards automated glycoproteomics analysis. Mass. Spectrom. Rev. 36, 475–498 (2016).
5. Dodds, E. D. Gas-phase dissociation of glycosylated peptide ions. Mass. Spectrom. Rev. 31, 666–682 (2012).
6. Wu, S. W., Pu, T. H., Viner, R. & Khoo, K. H. Novel LC-MS(2) product dependent parallel data acquisition function and data analysis workflow for sequencing and identification of intact glycopeptides. Anal. Chem. 86, 5478–5486 (2014).
楊芃原教授簡介
楊芃原教授,現(xiàn)任復(fù)旦大學(xué)化學(xué)系特聘教授,生物醫(yī)學(xué)研究院常務(wù)副院長。曾任中國人類蛋白質(zhì)組學(xué)學(xué)會理事長,質(zhì)譜學(xué)會常務(wù)理事,國家蛋白質(zhì)重大科學(xué)研究計劃專家組成員,兩次擔(dān)任國家重點基礎(chǔ)研究計劃(973計劃)首席科學(xué)家,除此之外還主持了多項國家自然科學(xué)基金委重大重點項目與上海市創(chuàng)新團隊項目。曾獲教育部自然科學(xué)一等獎、二等獎、福建省科技進步一等獎,教育部科技進步二等獎等多個獎項。以通訊作者發(fā)表SCI論文兩百余篇。主要研究方向為生物質(zhì)譜儀器開發(fā)與應(yīng)用。
賀思敏研究員簡介
賀思敏,現(xiàn)任中科院北京計算技術(shù)研究所研究員。1986年-1991年本科畢業(yè)于清華大學(xué)計算機科學(xué)與技術(shù)專業(yè);1991年-1997年繼續(xù)在清華大學(xué)計算機科學(xué)與技術(shù)專業(yè)獲得博士學(xué)位;1997年-2002年,國家智能計算機研究中心-摩托羅拉聯(lián)合實驗室,北京算通科技發(fā)展有限公司;2002年7月- 中國科學(xué)院計算技術(shù)研究所。主要研究方向為:應(yīng)用算法學(xué)、生物信息學(xué)、信息檢索。與生物醫(yī)學(xué)相關(guān)的主要成果是主持研制我國第一套規(guī)?;鞍踪|(zhì)序列鑒定軟件系統(tǒng)pFind。近年來的研究工作主要發(fā)表在Nature Method、Nature Communications、Bioinformatics、Journal of Proteome Research、 Scientific Reports等雜志上。
黃超蘭研究員簡介
黃超蘭,現(xiàn)任中科院上海生化與細胞研究所上海(國家)蛋白質(zhì)中心研究員。1994年香港中文大學(xué)取得學(xué)士學(xué)位后,于1996年進入香港大學(xué)研究院(化學(xué)系)獲理學(xué)碩士(1998)和博士學(xué)位(2002)。博士論文專門研究基本原理質(zhì)譜 (Fundamental mass spectrometry) 中的氨基酸和多肽的氣相裂解機理 (gas phase fragmentation mechanism of amino acid and peptide) 。2003-2005 在香港大學(xué)化學(xué)系支志明教授組從事研究助理,協(xié)助港大生物醫(yī)藥開發(fā)中心(BDC,HKU)和香港特區(qū)衛(wèi)生部(Department of Health, HKSAR)建立新的標準化分析實驗室,制定政府中藥藥典。于2005 年4月以訪問科學(xué)家身份到John Yates 教授 (The Scripps Research Institute, TSRI)實驗室,2006 年成為John的博士后研究員,2008 年被聘為Staff Scientist, 2010 年晉升為Senior Staff Scientist,并同時為國家中心研究資源(NIH)的酵母資源中心(Yeast Resource Center, YRC)和Scripps生理蛋白質(zhì)組學(xué)研究中心(Center for Physiological Proteomics, CPP)的Lead Scientist。2013年1月起,任中科院上海生科院生化與細胞所研究員、國家蛋白科學(xué)中心質(zhì)譜系統(tǒng)主管。2014年入選中科院引進杰出技術(shù)人才。