來源:網(wǎng)絡(luò) 時(shí)間:2025-07-26
當(dāng)人類基因組計(jì)劃完成草圖時(shí),科學(xué)家們首次拼湊出約30億個(gè)堿基對(duì)的“生命天書”;而20年后,借助長(zhǎng)讀長(zhǎng)測(cè)序技術(shù)的突破,一場(chǎng)更精細(xì)的“基因組考古”正在改寫我們對(duì)遺傳變異的認(rèn)知。近日,兩項(xiàng)發(fā)表于《自然》(Nature)雜志的國(guó)際合作研究,利用牛津納米孔(Oxford Nanopore)和太平洋生物科學(xué)(PacBio)的長(zhǎng)讀長(zhǎng)測(cè)序技術(shù),對(duì)“千人基因組計(jì)劃”(1000 Genomes Project)的千余份樣本進(jìn)行了深度解析,首次繪制出覆蓋全球26個(gè)人群的“結(jié)構(gòu)變異(SVs)高清地圖”,揭示了超16萬種此前未被發(fā)現(xiàn)的人類基因組變異細(xì)節(jié)。
從“短讀長(zhǎng)”到“長(zhǎng)讀長(zhǎng)”:基因組變異檢測(cè)的“分辨率革命”
自2008年啟動(dòng)以來,“千人基因組計(jì)劃”通過短讀長(zhǎng)測(cè)序(每次讀取約150-300個(gè)堿基對(duì))構(gòu)建了人類基因組變異的“基礎(chǔ)地圖”,但受限于技術(shù),短讀長(zhǎng)難以捕捉重復(fù)序列、高度相似區(qū)域(如同源染色體)及大段插入/缺失等復(fù)雜結(jié)構(gòu)變異(SVs)。這些“隱藏”的變異被認(rèn)為與癌癥、罕見病、自閉癥等多種疾病密切相關(guān),卻長(zhǎng)期處于研究的“盲區(qū)”。
此次突破的核心,正是長(zhǎng)讀長(zhǎng)測(cè)序技術(shù)的成熟——其單次讀取長(zhǎng)度可達(dá)數(shù)十萬甚至數(shù)百萬個(gè)堿基對(duì),能跨越復(fù)雜區(qū)域“全景式”掃描基因組。正如歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL)的揚(yáng)·科爾貝爾(Jan Korbel)所言:“新技術(shù)讓我們能組裝完整的人類基因組,系統(tǒng)檢查每個(gè)區(qū)域的變異,這是短讀長(zhǎng)時(shí)代無法想象的?!?nbsp;
1019份樣本的“變異全景圖”:發(fā)現(xiàn)超16萬種新結(jié)構(gòu)變異
在第一項(xiàng)研究中,由科爾貝爾領(lǐng)銜的國(guó)際團(tuán)隊(duì)分析了來自歐洲、東亞、南亞、非洲和美洲26個(gè)人群的1019份“千人基因組計(jì)劃”樣本,結(jié)合長(zhǎng)讀長(zhǎng)測(cè)序與自主研發(fā)的“圖增強(qiáng)結(jié)構(gòu)變異分析(SAGA)”算法,共檢測(cè)到每個(gè)樣本平均15,301至21,529種結(jié)構(gòu)變異(包括缺失、重復(fù)、插入、倒位等),并在967份匹配高覆蓋短讀長(zhǎng)數(shù)據(jù)的樣本中,鑒定出近167,300個(gè)主要變異位點(diǎn)。
更關(guān)鍵的是,約51%的插入變異和14.5%的缺失變異是此前從未被記錄的“新變異”。這些變異廣泛分布于基因組的“復(fù)雜區(qū)域”——例如包含大量重復(fù)序列的著絲粒、免疫相關(guān)的“主要組織相容性復(fù)合體(MHC)”區(qū)域,以及與癌癥相關(guān)的致癌基因附近。
“原‘千人基因組計(jì)劃’標(biāo)記了基因組的‘變異熱點(diǎn)’,而我們的工作讓這些熱點(diǎn)‘高清化’。”論文合著者、EMBL-EBI研究員薩拉·亨特(Sarah Hunt)解釋,“新圖譜的精度和深度遠(yuǎn)超以往,未來有望直接關(guān)聯(lián)更多疾病風(fēng)險(xiǎn)?!?nbsp;
65個(gè)“近完成基因組”:揭開Y染色體與移動(dòng)元件的“隱秘世界”
第二項(xiàng)研究由“千人基因組計(jì)劃”人類基因組結(jié)構(gòu)變異聯(lián)盟(HGSVC)主導(dǎo),聚焦65個(gè)個(gè)體的“近乎完整”基因組組裝(覆蓋99%以上序列)。通過整合長(zhǎng)讀長(zhǎng)測(cè)序、光學(xué)圖譜(Bionano)、Hi-C染色質(zhì)構(gòu)象捕獲等技術(shù),團(tuán)隊(duì)首次構(gòu)建了130個(gè)單倍型解析的基因組組裝(即區(qū)分同源染色體的差異),并覆蓋了1,246個(gè)人類著絲粒序列——此前這些區(qū)域因高度重復(fù)被視為“測(cè)序禁區(qū)”。
研究顯示,每個(gè)個(gè)體平均攜帶26,115種結(jié)構(gòu)變異,其中包括12,919種移動(dòng)元件插入(如轉(zhuǎn)座子)。更令人振奮的是,團(tuán)隊(duì)首次完成了6個(gè)個(gè)體的“端粒到端?!盰染色體組裝(覆蓋整個(gè)Y染色體),揭示了Yq12區(qū)域(高度異染色質(zhì))的精細(xì)結(jié)構(gòu)?!艾F(xiàn)在,我們可以精確說出一個(gè)突變的起點(diǎn)、終點(diǎn)和具體形態(tài)。”論文共同第一作者、杰克遜實(shí)驗(yàn)室計(jì)算生物學(xué)家彼得·奧達(dá)諾(Peter Audano)表示,“這對(duì)自閉癥、罕見病和癌癥研究而言,是跨越數(shù)十年的進(jìn)步。”
從“數(shù)據(jù)”到“應(yīng)用”:疾病研究的“新工具箱”
兩項(xiàng)研究的成果不僅是學(xué)術(shù)突破,更直接指向臨床轉(zhuǎn)化。例如,研究團(tuán)隊(duì)利用長(zhǎng)讀長(zhǎng)測(cè)序分析了4名罕見病患者的全基因組,平均鎖定了386個(gè)候選結(jié)構(gòu)變異,并發(fā)現(xiàn)這些變異集中在270個(gè)已知致病基因的復(fù)雜區(qū)域——這意味著,此前因技術(shù)限制被遺漏的“致病變異”將被重新“挖掘”。
“現(xiàn)在,科學(xué)家研究癌癥驅(qū)動(dòng)突變、罕見病致病基因時(shí),終于能‘看清’整個(gè)基因組的‘地形’?!眾W達(dá)諾比喻道,“過去我們像在霧中摸象,現(xiàn)在至少有了清晰的輪廓。”
不過,研究者也坦言挑戰(zhàn)猶存:極罕見結(jié)構(gòu)變異的檢測(cè)能力仍需提升,長(zhǎng)讀長(zhǎng)數(shù)據(jù)的“一致性”(不同技術(shù)平臺(tái)的結(jié)果整合)仍需優(yōu)化,且大規(guī)模人群的泛基因組分析(如納入更多非裔、原住民樣本)亟待擴(kuò)展。正如論文作者指出:“未來的工作需要改進(jìn)圖算法,將單核苷酸多態(tài)性(SNPs)、插入缺失(indels)和短串聯(lián)重復(fù)序列(STRs)納入統(tǒng)一分析框架?!?nbsp;
人類基因組的“終極拼圖”漸趨完整
從2001年人類基因組草圖的發(fā)布,到2023年人類泛基因組參考項(xiàng)目的推出,再到今日長(zhǎng)讀長(zhǎng)測(cè)序?qū)Y(jié)構(gòu)變異的“高清解碼”,人類對(duì)自身遺傳密碼的認(rèn)知正以指數(shù)級(jí)速度躍遷。正如海因里?!ずD髮W(xué)杜塞爾多夫分校的托比亞斯·馬沙爾(Tobias Marschall)所言:“這兩項(xiàng)研究不僅構(gòu)建了一個(gè)醫(yī)學(xué)相關(guān)的資源寶庫,更開啟了‘精準(zhǔn)基因組學(xué)’的新紀(jì)元——未來,每個(gè)人都能擁有自己的‘變異地圖’,而疾病治療也將真正進(jìn)入‘按圖索驥’的時(shí)代?!?nbsp;
【來源:摘自網(wǎng)絡(luò)】 聲明:轉(zhuǎn)載此文是出于傳遞更多信息之目的。若有來源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益,請(qǐng)作者持權(quán)屬證明與本網(wǎng)聯(lián)系,我們將及時(shí)更正、刪除,謝謝。 郵箱地址:xlg@xhpr.net