首頁(yè)
產(chǎn)品服務(wù)
心血管疾病系列腎病系列腫瘤系列心血管用藥系列腎病用藥系列二代測(cè)序商業(yè)試劑盒
科研合作
新聞中心
關(guān)于我們
多種方法結(jié)合提高WGS數(shù)據(jù)檢測(cè)CNV結(jié)果的準(zhǔn)確性
發(fā)布時(shí)間:2021-11-19 19:00:00來(lái)源:
1637908217897149.gif


1637908296409567.jpg


背景


拷貝數(shù)變異(CNVs)是大于50個(gè)堿基對(duì)的缺失、重復(fù)或插入,在人類基因組變異中占很大比例,對(duì)人的身體健康有很大影響。目前,基于芯片的檢測(cè)方法在臨床中廣泛應(yīng)用,但全基因組測(cè)序(WGS)有望同時(shí)檢測(cè)CNVs和更小的變異,因此,利用WGS數(shù)據(jù)準(zhǔn)確的檢測(cè)CNVs在臨床檢測(cè)中至關(guān)重要。目前,基于WGS數(shù)據(jù)檢測(cè)CNV的算法原理大致分為:paired-end reads, split reads和coverage depth,文章通過(guò)4種基于不同算法原理的CNV檢測(cè)軟件(Manta, Delly, ERDS, CNVnator)和一個(gè)基因分型工具(SV2)結(jié)合,得到可靠的CNVs結(jié)果。


分析方法

文章從24例肢體畸形患者中隨機(jī)抽取10例作為訓(xùn)練組。對(duì)10例樣本進(jìn)行aCGH檢測(cè)CNV并通過(guò)IGV確認(rèn),同時(shí)基于~30X WGS數(shù)據(jù),選擇4個(gè)效果較好的CNV鑒定工具(Manta, Delly, ERDS, CNVnator)進(jìn)行下一步的分析。通過(guò)不同軟件的組合與過(guò)濾獲得最終檢測(cè)結(jié)果,確定結(jié)果的準(zhǔn)確性,并通過(guò)剩余的14例樣本進(jìn)行方案驗(yàn)證(圖 1)。


1637908441799102.jpg

圖 1. 樣本選擇與分析流程


對(duì)于4種CNV檢測(cè)軟件,Delly與Manta的原理主要是基于paired-end檢測(cè),CNVnator與ERDS的原理主要是基于coverage depth檢測(cè),文章對(duì)CNV檢測(cè)結(jié)果進(jìn)行過(guò)濾與合并:對(duì)于相同原理軟件的檢測(cè)結(jié)果,如果CNV區(qū)域存在75%的交集,檢測(cè)到不同類型的CNV則刪除結(jié)果,檢測(cè)到相同類型的CNV則合并結(jié)果;不同原理軟件之間的結(jié)果,交集的區(qū)域調(diào)整為50%;再通過(guò)SV2進(jìn)行基因分型,并對(duì)所有CNV結(jié)果進(jìn)行比較過(guò)濾(圖 2)。


1637908458388505.jpg

圖 2. CNV結(jié)果分析流程


分析結(jié)果

4種軟件的檢測(cè)結(jié)果差異較大。其中基于paired-end的軟件檢測(cè)到更多的CNV結(jié)果,尤其在50bp-1kb的缺失中差異明顯;CNVnator對(duì)1-50k范圍內(nèi)的檢測(cè)則更加敏感;相同檢測(cè)原理的軟件之間檢測(cè)結(jié)果一致性相對(duì)較高;Delly和CNVnator相比于Manta和ERDS軟件更加敏感,而Manta和ERDS的檢測(cè)結(jié)果在大約一半的病例中得到相互驗(yàn)證(圖 3)。


1637908480992513.jpg

圖 3. 4種軟件的檢測(cè)結(jié)果


對(duì)檢測(cè)結(jié)果隨機(jī)選擇1278個(gè)缺失和748個(gè)插入進(jìn)行IGV查看驗(yàn)證,軟件檢測(cè)結(jié)果與真實(shí)的CNV區(qū)域重疊范圍為6.6%-89.5%之間,小的缺失型CNV比插入和大的缺失型CNV更易被檢出。ERDS和Manta軟件對(duì)1-50 kb缺失型CNV的檢測(cè)更準(zhǔn)確;Delly和CNVnator軟件對(duì)1 ~ 5 kb缺失型CNV的真陽(yáng)性率達(dá)到50%以上;ERDS對(duì)大片段CNV檢測(cè)的敏感性最高;超過(guò)50kb的插入型CNV在基于coverage depth檢測(cè)的軟件中敏感性較高,但是此類CNV通過(guò)IGV查看時(shí)都沒(méi)有得到驗(yàn)證。驗(yàn)證結(jié)果顯示,假陽(yáng)性的CNV大多只由一種軟件檢出,多種軟件中共同檢出的結(jié)果基本可以確保真實(shí)性,而且大多真實(shí)的結(jié)果能夠通過(guò)genomAD數(shù)據(jù)庫(kù)得到驗(yàn)證(圖 4)。


1637908499549262.jpg

圖 4. 不同軟件對(duì)不同類型CNV的檢測(cè)結(jié)果及IGV驗(yàn)證


通過(guò)366個(gè)真實(shí)的CNV(329個(gè)缺失,37個(gè)插入)和940個(gè)假陽(yáng)性CNV(505個(gè)缺失,435個(gè)插入)對(duì)CNV過(guò)濾方法的準(zhǔn)確度進(jìn)行評(píng)估。結(jié)果表明,根據(jù)4種軟件的結(jié)果對(duì)CNVs進(jìn)行過(guò)濾,對(duì)真實(shí)的靈敏度沒(méi)有影響,而且可以增加準(zhǔn)確性;SV2基因分型對(duì)缺失表現(xiàn)良好,但對(duì)插入的敏感性較低(圖 5)。


1637908516351204.jpg

圖 5. 4種軟件結(jié)合與SV2過(guò)濾的CNV結(jié)果。


結(jié)論 

利用WGS數(shù)據(jù)檢測(cè)CNV可以解決aCGH中檢測(cè)區(qū)域局限、斷點(diǎn)不明確的問(wèn)題,但傳統(tǒng)的檢測(cè)方法準(zhǔn)確性不高,而使用高深度或長(zhǎng)讀長(zhǎng)測(cè)序的成本太高,不適用于臨床檢測(cè)。文章中使用多種CNV檢測(cè)工具進(jìn)行過(guò)濾的方法很好的解決了上述問(wèn)題,4種檢測(cè)軟件依據(jù)不同的算法原理檢測(cè)CNV,結(jié)合不同軟件結(jié)果可以有效提高檢測(cè)的準(zhǔn)確性,為WGS數(shù)據(jù)檢測(cè)CNV的臨床應(yīng)用開(kāi)辟了新思路。


參考文獻(xiàn)

Coutelier, M., Holtgrewe, M., J?ger, M. et al. Combining callers improves the detection of copy number variants from whole-genome sequencing. Eur J Hum Genet (2021). https://doi.org/10.1038/s41431-021-00983-x.


推薦新聞

咨詢服務(wù)熱線

+86 10 5849 9280

? Copyright - 安智因 京ICP備18055458號(hào)-1