來源:知識分子 時間:2020-07-28
人類基因組計劃啟動于1990年,如今已匆匆過去30年光景。從2000年人類基因組草圖宣告完成后的二十年間,人類參考基因組不斷更新迭代。即便如此,其中依然存在數(shù)以百計的空缺,尚無一條染色體被真正完成 [1]。
如今,科學家首次完成了一條 “從頭到尾” 真正完整的人類染色體測序。7月14日,《自然》雜志上刊載了美國加利福尼亞大學圣克魯茲分校的 Karen Miga 教授團隊的研究成果 [2]。該團隊使用最新的納米孔測序技術,首次完成了從端粒到端粒、完整無缺的人類X染色體序列。這或許意味著,真正完成人類基因組測序的時代已經(jīng)觸手可及。
1、霰彈槍、拼圖與地圖上的空缺
過去,人類基因組計劃使用的測序方法只能用來測定較短的DNA序列,長度在100到1000個堿基對間。因此,較長的序列被剪切成末端重復的碎片,并依靠這些重復的部分將碎片重新組裝成完整的序列。這種測序方法也被形象地稱為 “霰彈槍測序法”。
這種方法重建基因組的最大挑戰(zhàn)在于如何區(qū)分重復的序列 [3]。人類基因中有大量重復的序列,這使得測定出來的許多短鏈幾乎一模一樣,既難以拼接,也難以判斷到底存在多少個重復區(qū)段。就像拼圖中我們往往把天空或湖水的部分留到最后,因為在大片的同色色塊里,我們便難以確認具體某塊拼圖的位置一樣。
現(xiàn)在參考基因組中的空缺包括核糖體DNA序列,著絲粒(在細胞分裂時連接兩條染色體單體的部位,它們將染色體分為長臂和短臂)中高度重復的DNA序列,此外,還有一些富含重復片段的區(qū)域,這些重復片段動輒有超過數(shù)十萬堿基對,重復率超過98% [2]?!澳壳盎蚪M圖譜上缺失的部分,也恰是在人群中序列變異最多的部分,也因此為基因生物學和人類疾病的研究提供了未經(jīng)探索的序列。完整的基因組圖譜有潛力加深我們對遺傳疾病的了解。而我們選擇X染色體的研究正是因為它和無數(shù)的疾病有關,其中包括血友病,慢性肉芽腫性疾病和杜氏肌營養(yǎng)不良。” Miga 教授告訴《知識分子》。
2、基因的 “安檢儀”
要應對黑暗區(qū)域的挑戰(zhàn)有兩種途徑:要么測的序列長到可以覆蓋一整個重復部分;要么測序足夠精確,可以通過區(qū)分獨特的變量來區(qū)分重復的序列 [4]。最新的納米孔測序技術為超長測序提供了可能。
圖1:DNA通過納米孔,隨著G、A、T、C堿基以不同的序列通過,電流也產(chǎn)生不同的變化(來源:參考文獻5)
在實驗中,研究人員讓DNA鏈通過一個嵌在電阻膜上的納米孔,就像行李通過X光安檢儀一樣,“掃描” 出DNA上的堿基序列。在測序時,電阻膜被浸入電解質(zhì)溶液中,并讓離子電流通過納米孔,當DNA鏈上不同的堿基通過納米孔時,會對這個電流產(chǎn)生干擾。通過解碼這些電流信號,研究人員就可以測得特定的DNA或RNA片段。
納米孔技術不僅可以實時分析長DNA片段,而且理論上不再有DNA的長度限制。Miga 教授告訴《知識分子》,“如果你能讓一條百萬堿基對長的DNA通過納米孔,它就能識別整條序列。使用了這種超長測序技術后,我們可以獲得一個非常非常長鏈的(超過十萬堿基對)、高覆蓋率的數(shù)據(jù)庫,從而幫助我們跨越和準確拼裝富含重復序列的安檢儀。”
3、新的里程碑
Miga 教授和她的團隊完成的X染色體序列完整無缺,且估算有至少99.99%的準確率,這意味著平均每1萬堿基對才有一個錯誤。在對X染色體的研究中,Miga教授和她的團隊重建了約2.8兆堿基對的著絲粒中的DNA序列,并且填補了X染色體所剩的29個空缺部分,包括擬常染色體區(qū)域和CT抗原基因家族中的新序列,CT抗原基因家族是一種腫瘤特異性抗原,有望用作癌癥的免疫治療 [2]。
加利福尼亞大學圣克魯茲分校的助理研究科學家 Jain Miten 告訴《知識分子》,“端粒到端粒的完整染色體測序是基因組學里程碑式的時刻,而超長測序的技術和算法的發(fā)展是使之得以實現(xiàn)的主要因素之一。了解這些曾是未知的‘黑暗區(qū)域’的序列結構和表觀基因序列圖譜,會為生物學帶來新的視角。同時,這也是一個分階段的,端粒到端粒的,完整基因組時代到來的界標?!?/span>
接下來,Miga 教授和她的團隊將繼續(xù)致力于從人類基因組剩余的 “處女地” 上捕捉新的序列和表觀基因的變異。Miga 教授表示:“我們目前已經(jīng)有了巨大的進展,并且希望可以在不遠的未來和公眾分享。我們發(fā)現(xiàn)有一些特定的染色體比其他的更容易組裝(比如8號和6號)。最難的染色體是帶著幾乎相同的核糖體DNA序列的近端著絲粒染色體如13、14、15、21和22號。同時我們也需要開發(fā)新的技術來面對1號、9號和16號染色體上大型人類衛(wèi)星DNA序列的挑戰(zhàn)?!?