時(shí)間:2018-02-07 來源:CICC菌種平臺(tái)
熟悉分類學(xué)的小伙伴都知道,在描述微生物新物種時(shí),形態(tài)學(xué)、生理生化、化學(xué)、分子生物學(xué)等特征是標(biāo)配指標(biāo),不過這一配置即將升級(jí)。近日,微生物系統(tǒng)分類的國(guó)際權(quán)威期刊《International Journal of Systematic and Evolutionary Microbiology》在其官網(wǎng)發(fā)布新聞“Genome sequencing data required with Taxonomic Descriptions”,國(guó)際系統(tǒng)與進(jìn)化微生物學(xué)雜志(IJSEM)即將要求作者提供基因組測(cè)序數(shù)據(jù),并在分類學(xué)描述中提供新的分類單元的描述?;蚪M序列對(duì)原核生物的系統(tǒng)學(xué)研究具有重要價(jià)值,除了提高對(duì)微生物生物學(xué)的一般認(rèn)識(shí)外,它們還提高了原核生物的鑒定、有助于分類單元的鑒定和高等分類單元系統(tǒng)發(fā)育的解析。雖然公布基因組測(cè)序數(shù)據(jù)并非強(qiáng)制性的,但強(qiáng)烈建議列入這一基因組測(cè)序數(shù)據(jù)。如果作者因任何原因無法提供基因組測(cè)序數(shù)據(jù),則應(yīng)在其附信中說明這一點(diǎn);處理編輯將逐案審議考慮豁免。這項(xiàng)要求將從2018年1月起生效,IJSEM要求作者將數(shù)據(jù)存放在一個(gè)不需要查看者注冊(cè)的已建立的、免費(fèi)的公共數(shù)據(jù)庫中(即GenBank、ENA或DDBJ)。
IJSEM的這項(xiàng)申明意味著全基因組序列已成為微生物新種發(fā)表的標(biāo)配。發(fā)新種和不發(fā)新種的小伙伴們都看過來了,今天我們將要來說說“全基因組序列”的來頭。
1.什么是全基因組序列
全基因組序列(Whole GenomeSequence, WGS)是細(xì)胞內(nèi)以核苷酸序列形式存儲(chǔ)的所有遺傳信息,體現(xiàn)為代表四種堿基的ATCG四個(gè)字母所組成的一串字符。WGS能夠最大程度提供關(guān)于微生物分類地位的遺傳信息,在實(shí)際操作中,其所兼容覆蓋的GC含量測(cè)定、DNA-DNA雜交等相對(duì)繁瑣操作有望因此略去;同時(shí)WGS代表微生物個(gè)體中DNA遺傳物質(zhì)的總和,這有利于后續(xù)對(duì)菌株在基因組水平上的深層次遺傳挖掘。小編私以為這是IJSEM期刊將WGS納入新種發(fā)表必備指標(biāo)的主要原因。
圖1. 流感嗜血桿菌 Haemophilus influenzae Rd,1.83 Mb,1995年首個(gè)測(cè)序完成的細(xì)菌(Fleischmann et al., 1995)
2.如何獲得全基因組序列
目前,測(cè)序技術(shù)的發(fā)展使我們獲得一個(gè)微生物的WGS已如“把大象裝冰箱”一般簡(jiǎn)單:第一步,提取微生物的基因組;第二步,對(duì)基因組中的堿基進(jìn)行讀?。坏谌?,數(shù)據(jù)質(zhì)控和拼接完成基因組。后兩步目前常規(guī)的生物測(cè)序公司都可提供。其中核心的第二步需要借助測(cè)序儀完成。以Illumina為代表的第二代高通量測(cè)序技術(shù)是當(dāng)前測(cè)序市場(chǎng)的主流,國(guó)內(nèi)華大基因也相繼推出了其自主研發(fā)的測(cè)序儀,例如BGISEQ-500等。相較于一代Sanger測(cè)序技術(shù),二代高通量測(cè)序技術(shù)數(shù)據(jù)量更大、成本更低。不斷推陳出新的測(cè)序技術(shù)和測(cè)序平臺(tái)使得當(dāng)前完成一株菌的全基因組測(cè)序成本大大下降,這也為IJSEM期刊要求新種發(fā)表時(shí)必備全基因組序列提供了實(shí)際可行性。
3.全基因組序列在微生物分類和溯源中的作用
如前面提到的,WGS能提供菌株分類最豐富的遺傳信息,在微生物菌種水平鑒定中具有最大分辨率力,許多利用16S rRNA序列“金標(biāo)準(zhǔn)”無法鑒定其物種的菌株可基于全基因組序列進(jìn)一步鑒定到種。對(duì)于同種內(nèi)不同菌株的分型,尤其是污染菌的溯源分析具有較高技術(shù)難度,脈沖場(chǎng)凝膠電泳(PFGE)和核糖體分型(Ribotyping)等是美國(guó)藥典USP和中國(guó)藥典2015版推薦的分型方法,但在面臨相似性非常高的菌株時(shí)同樣可能會(huì)束手無策。全基因組數(shù)據(jù)能夠更全面遺傳信息基礎(chǔ)上對(duì)菌株進(jìn)行有效區(qū)分,且現(xiàn)已成為FDA、美國(guó)CDC、EFSA等組織監(jiān)控病源菌疾病暴發(fā)的常規(guī)技術(shù)方法。
圖2. 2014年美國(guó)暴發(fā)焦糖蘋果-李斯特菌污染事件,基于全基因組序列的SNP分型方法能夠提供
高于PFGE的分辨率,準(zhǔn)確病原菌分支(Carleton et al, 2016)
由于蘊(yùn)含了整個(gè)菌株全部的遺傳信息,全基因組數(shù)據(jù)還能夠用于毒力基因、耐藥基因以及外源基因等靶向定位檢測(cè),次級(jí)代謝、功能基因預(yù)測(cè)與分析;由純菌株的全基因組可擴(kuò)展至環(huán)境樣品的基因組,即宏基因,能夠?yàn)閺?fù)雜環(huán)境樣品中的微生物組成、代謝、功能、差異表達(dá)基因進(jìn)行全方位綜合分析,解析微生物在環(huán)境中組成與動(dòng)態(tài)功能性相互作用。
值得一提的是,全基因組的數(shù)據(jù)可提交到NCBI等公開數(shù)據(jù)庫保存,不同實(shí)驗(yàn)室可免費(fèi)下載分析,真正實(shí)現(xiàn)大數(shù)據(jù)的共享。
近期,CICC參加了由WDCM和中國(guó)科學(xué)院微生物研究所牽頭聯(lián)合十余家國(guó)際菌種保藏中心的全球微生物模式菌株基因組和微生物組測(cè)序合作計(jì)劃,將陸續(xù)補(bǔ)充整理新種發(fā)表微生物模式菌株基因組數(shù)據(jù),5年內(nèi)完成超過1萬種微生物模式菌株微生物全基因組測(cè)序,期待您的支持與參與。