來(lái)源:測(cè)序中國(guó) 時(shí)間:2022-11-21
多年來(lái),基因融合被認(rèn)為是重要的癌癥驅(qū)動(dòng)事件,通常在腫瘤發(fā)生和進(jìn)展中發(fā)揮關(guān)鍵作用,也可作為治療靶點(diǎn)。大量的分析工具已經(jīng)開(kāi)發(fā)并應(yīng)用于短讀長(zhǎng)癌癥轉(zhuǎn)錄組測(cè)序數(shù)據(jù)進(jìn)行基因融合檢測(cè)。但從短reads中識(shí)別嵌合reads或不一致reads總是具有挑戰(zhàn)性的。
近年來(lái),長(zhǎng)讀長(zhǎng)RNA測(cè)序技術(shù)的發(fā)展使全長(zhǎng)轉(zhuǎn)錄本測(cè)序成為可能,在基因融合檢測(cè)中顯示出巨大的潛力。目前,用于長(zhǎng)讀長(zhǎng)基因融合檢測(cè)的工具只有JAFFAL和LongGF兩種,在檢測(cè)內(nèi)含子區(qū)發(fā)生的基因融合時(shí),其性能受到限制。此外,基因融合的精確序列也仍然未知,限制了對(duì)基因融合的進(jìn)一步功能分析。
近日,美國(guó)阿拉巴馬大學(xué)伯明翰分校的研究團(tuán)隊(duì),提出了一個(gè)基因融合檢測(cè)工具FusionSeeker,可以準(zhǔn)確全面地識(shí)別長(zhǎng)讀長(zhǎng)癌癥轉(zhuǎn)錄組測(cè)序數(shù)據(jù)中的基因融合事件,并從原始reads中重建準(zhǔn)確的融合轉(zhuǎn)錄本。FusionSeeker是根據(jù)reads數(shù)量檢測(cè)基因融合調(diào)并進(jìn)行過(guò)濾,以去除由于測(cè)序錯(cuò)誤和reads比對(duì)錯(cuò)誤造成的噪聲信號(hào)。經(jīng)驗(yàn)證,FusionSeeker可識(shí)別外顯子和內(nèi)含子區(qū)域的基因融合,允許對(duì)癌癥轉(zhuǎn)錄組中的基因融合進(jìn)行全面表征。該研究結(jié)果發(fā)表Cancer Research上,文章題為“Gene fusion detection and characterization in long-read cancer transcriptome sequencing data with FusionSeeker”。
研究團(tuán)隊(duì)首先在模擬數(shù)據(jù)集上對(duì)FusionSeeker基因融合檢測(cè)的準(zhǔn)確性進(jìn)行了基準(zhǔn)測(cè)試,共隨機(jī)生成150個(gè)基因融合轉(zhuǎn)錄本,并分配到不同的表達(dá)水平。PacBio Iso-Seq-like和Nanopore-like reads用PBSIM和Badread(v0.2.0)模擬,然后對(duì)齊到參考基因組。FusionSeeker和長(zhǎng)鏈基因融合檢測(cè)工具JAFFAL和LongGF用于從模擬reads中檢測(cè)基因融合。研究團(tuán)隊(duì)重復(fù)了三次模擬,F(xiàn)usionSeeker識(shí)別出的真陽(yáng)性事件更多。同時(shí),F(xiàn)usionSeeker的高召回率主要得益于其檢測(cè)內(nèi)含子區(qū)域基因融合的能力,其中FusionSeeker識(shí)別了94.67%的內(nèi)含子事件,JAFFAL和LongGF分別報(bào)告了14.67%和54.67%。總的來(lái)說(shuō),以上三種融合檢測(cè)工具在檢測(cè)高表達(dá)水平和中表達(dá)水平因融合時(shí)可獲得更高的召回率。FusionSeeker丟失的基因融合中,大約67%來(lái)自低表達(dá)水平組,丟失的原因是reads覆蓋率低。
圖1.FusionSeeker檢測(cè)過(guò)程。
為了生成高精度的轉(zhuǎn)錄本序列,F(xiàn)usionSeeker使用包含融合的reads執(zhí)行部分順序比對(duì),為每個(gè)基因融合事件計(jì)算一致序列。在模擬數(shù)據(jù)集中,FusionSeeker重構(gòu)了超過(guò)99.5%的融合事件的全長(zhǎng)轉(zhuǎn)錄本,使用Iso-Seq和Nanopore reads的平均序列識(shí)別率分別為99.87%和99.14%。表明FusionSeeker可以準(zhǔn)確地識(shí)別基因融合,并在模擬數(shù)據(jù)集中報(bào)告全長(zhǎng)融合轉(zhuǎn)錄本序列。
接下來(lái),研究團(tuán)隊(duì)利用人類(lèi)基因組結(jié)構(gòu)變異聯(lián)盟(HGSVC)的非癌癥數(shù)據(jù)集評(píng)估了三種工具的錯(cuò)誤發(fā)現(xiàn)率。在所有12個(gè)非癌癥樣本中,F(xiàn)usionSeeker報(bào)告的基因融合數(shù)量最少,表明在三種基因融合檢測(cè)工具中,F(xiàn)usionSeeker的錯(cuò)誤發(fā)現(xiàn)率最低。研究團(tuán)隊(duì)還將FusionSeeker應(yīng)用于一個(gè)急性髓系白血?。ˋML)患者樣本分析,以證明其臨床實(shí)用性。最終FusionSeeker識(shí)別出了RUNX1和RUNX1T1之間的一個(gè)預(yù)驗(yàn)證基因融合,并報(bào)告了該患者樣本中另外7個(gè)可信的基因融合事件。
最后,該研究團(tuán)隊(duì)評(píng)估了由FusionSeeker生成的轉(zhuǎn)錄本序列。與原始reads相比,在MCF-7細(xì)胞系的Iso-Seq和Nanopore數(shù)據(jù)集中,FusionSeeker轉(zhuǎn)錄本序列與參考基因序列的一致性顯著提高(圖2)。在SKBR3的Iso-Seq數(shù)據(jù)集和HCT-116細(xì)胞系的Nanopore數(shù)據(jù)集中,F(xiàn)usionSeeker報(bào)告的轉(zhuǎn)錄本序列比原始reads更準(zhǔn)確。
圖2.FusionSeeker轉(zhuǎn)錄本序列與參考基因序列對(duì)比。
綜上所述,F(xiàn)usionSeeker可以檢測(cè)到外顯子和內(nèi)含子區(qū)域的基因融合?;谀M和三個(gè)癌細(xì)胞系的數(shù)據(jù),該研究證明了FusionSeeker在檢測(cè)基因融合事件方面優(yōu)于現(xiàn)有方法。此外,研究團(tuán)隊(duì)通過(guò)正交和實(shí)驗(yàn)驗(yàn)證了許多僅由FusionSeeker檢測(cè)到的基因融合事件。這些新的基因融合可能對(duì)腫瘤的發(fā)生和進(jìn)展有重要意義,值得進(jìn)一步研究。總體而言,F(xiàn)usionSeeker將使用戶(hù)能夠使用長(zhǎng)讀長(zhǎng)測(cè)序取數(shù)據(jù)準(zhǔn)確地發(fā)現(xiàn)基因融合,促進(jìn)下游功能分析,并改善癌癥的診斷和治療。
參考文獻(xiàn):
Yu Chen, Yiqing Wang, Weisheng Chen,et al. Gene fusion detection and characterization in long-read cancer transcriptome sequencing data with FusionSeeker. Cancer Res CAN-22-1628. 2022. https://doi.org/10.1158/0008-5472.CAN-22-1628
【來(lái)源:摘自測(cè)序中國(guó)】
聲明:轉(zhuǎn)載此文是出于傳遞更多信息之目的。若有來(lái)源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益,請(qǐng)作者持權(quán)屬證明與本網(wǎng)聯(lián)系,我們將及時(shí)更正、刪除,謝謝。 郵箱地址:xlg@xhpr.net