來源:青島能源所 時間:2020-03-20

微生物組具有服務(wù)疾病診治與生態(tài)監(jiān)控的巨大潛力,但是其影響因素錯綜復(fù)雜。如何通過菌群檢測實現(xiàn)快速精準(zhǔn)的疾病診斷呢?中國科學(xué)院青島生物能源與過程研究所單細(xì)胞中心發(fā)明了基于菌群大數(shù)據(jù)搜索的疾病檢測方法,為此共性問題提供了原創(chuàng)的解決方案。該工作于3月17日在線發(fā)表于mSystems(美國微生物學(xué)會會刊)。
作為與生俱來、無處不在的“小伙伴”,微生物組與人體、環(huán)境的健康有著千絲萬縷的關(guān)聯(lián)。同時,菌群檢測具有非侵入性、可量化、可預(yù)警等優(yōu)勢。因此,如何用菌群來判斷和識別人體或環(huán)境的健康狀態(tài),一直是精準(zhǔn)醫(yī)學(xué)和大健康的熱點問題之一。但是,作為一種疾病診斷手段,菌群面臨著三個關(guān)鍵的挑戰(zhàn)。
首先,“漏診”問題:現(xiàn)有的檢測手段通常只針對特定疾病,并依賴于該疾病已知的標(biāo)識微生物來構(gòu)建檢測模型。然而很多疾病尚無明確標(biāo)識物,而且同一種疾病在不同人群中的生物標(biāo)識物種經(jīng)常不盡一致,因此難以普適性地判斷待檢樣本是否健康。其次,“誤診”問題:同一種生物標(biāo)識經(jīng)常與多種疾病相關(guān)聯(lián),導(dǎo)致難以準(zhǔn)確地分辨具體的疾病類型。此外,由于元基因組數(shù)據(jù)的極端高通量、高度異質(zhì)性、多種測序平臺共存等特點,菌群診斷模型的構(gòu)建、訓(xùn)練和更新,均具有突出的挑戰(zhàn)性。
針對上述關(guān)鍵問題,副研究員蘇曉泉帶領(lǐng)的單細(xì)胞中心組群生物信息研究組,利用前期開發(fā)的微生物組搜索引擎MSE,發(fā)明了基于菌群大數(shù)據(jù)搜索的疾病檢測新策略(圖1)。與現(xiàn)有基于模型訓(xùn)練的機器學(xué)習(xí)手段相比,該方法不再依賴于疾病相關(guān)的特定標(biāo)識微生物,而是利用待測菌群元基因組與已有菌群元基因組大數(shù)據(jù)的整體相似度來實現(xiàn)檢測。首先,計算待測樣本相對于數(shù)據(jù)庫中所有健康樣本的異常程度,即可評估其是否健康。其次,與數(shù)據(jù)庫中的多種疾病的參照樣本進(jìn)行比對,即可識別具體的患病種類?;诔^3000例腸道菌群樣本的測試表明,針對炎癥性腸?。↖BD)、結(jié)直腸癌(CRC)、艾滋病毒感染(HIV)和腸腹瀉?。‥DD)等,MSE在回答“是否健康”和“哪種疾病”這兩個問題上的準(zhǔn)確率均超過80%,顯著高于目前常用的機器學(xué)習(xí)算法,從而有效地降低了“漏診”和“誤診”的可能。另一方面,與常規(guī)手段相比,該方法在跨研究、跨測試人群、跨測序平臺、樣品污染等因素影響下的適應(yīng)性和抗干擾能力等方面,也具有顯著優(yōu)勢。
此外,得益于其強大的高通量菌群結(jié)構(gòu)搜索能力,MSE的使用與百度、谷歌一樣簡單,通常在0.5秒內(nèi)即能完成診斷。同時,MSE能夠通過其菌群大數(shù)據(jù)系統(tǒng)的實時更新,來提升檢測的可靠性以及拓寬其適用范圍。因此,隨著微生物組測序數(shù)據(jù)的爆發(fā)式增長,該方法在實際應(yīng)用中的便捷性、可延展性等特色將愈發(fā)突出。
單細(xì)胞中心開發(fā)的MSE是目前國內(nèi)外最大的微生物組數(shù)據(jù)科學(xué)研究體系之一,其參照數(shù)據(jù)庫包括來自腸道、皮膚、口腔、室內(nèi)環(huán)境、海洋、土壤等廣袤生態(tài)系統(tǒng)的超過23萬例高質(zhì)量、標(biāo)準(zhǔn)化、可比較的元基因組樣本。與本研究提出的診斷手段相結(jié)合,MSE為建立針對各種慢性疾病或生態(tài)災(zāi)害的菌群診斷系統(tǒng)和干預(yù)手段效能評價體系奠定了一個共性的方法學(xué)基礎(chǔ)。


京公網(wǎng)安備 11011402010390號