2024年10月14日, 深圳灣實(shí)驗(yàn)室腫瘤研究所孫坤團(tuán)隊(duì)在期刊《Cell Reports Methods》上發(fā)表了題為“Cell-free DNA end characteristics enable accurate and sensitive cancer diagnosis”的研究論文。在這項(xiàng)研究中,團(tuán)隊(duì)在末端選擇后,開發(fā)了3個(gè)cfDNA片段組學(xué)指標(biāo)。通過結(jié)合機(jī)器學(xué)習(xí),團(tuán)隊(duì)進(jìn)一步構(gòu)建了高性能診斷模型,在特異性為95%的情況下,曲線下總面積為0.95,靈敏度為85.1%。這項(xiàng)研究探討了cfDNA片段組學(xué)的最終特征及其在構(gòu)建準(zhǔn)確和靈敏的癌癥診斷模型方面的優(yōu)點(diǎn)。
https://www.cell.com/cell-reports-methods/fulltext/S2667-2375(24)00260-1
關(guān)于血漿循環(huán)游離DNA
01
血漿循環(huán)游離DNA(cfDNA)是一種經(jīng)過深入研究的分析物,用于無創(chuàng)產(chǎn)前檢測(cè)、癌癥診斷和治療監(jiān)測(cè)(即“癌癥液體活檢”)。研究人員發(fā)現(xiàn),cfDNA分子是通過與其起源組織高度相關(guān)的非隨機(jī)程序產(chǎn)生的。在最近的一項(xiàng)研究中,Cristiano等人表明,通過將cfDNA片段組學(xué)特征與機(jī)器學(xué)習(xí)方法相結(jié)合,可以獲得高性能的診斷模型。
在以前的研究中,團(tuán)隊(duì)和其他人證明,cfDNA的片段化與核小體結(jié)構(gòu)密切相關(guān)。此外,團(tuán)隊(duì)發(fā)現(xiàn),癌癥患者的總體cfDNA終結(jié)譜與對(duì)照受試者顯著不同,并進(jìn)一步開發(fā)了基于終結(jié)的指標(biāo)E指數(shù),用于癌癥診斷。在這項(xiàng)研究中,團(tuán)隊(duì)研究了cfDNA相對(duì)于核小體的特征(來源于造血細(xì)胞或直接從cfDNA覆蓋模式推斷),以進(jìn)一步探索cfDNA片段組學(xué)的生物學(xué)特性及其翻譯價(jià)值。
圖形摘要
末端選擇的cfDNA片段組學(xué)特征
02
末端選擇后,cfDNA的總體大小分布與未進(jìn)行末端選擇后相似。例如,在166bp處出現(xiàn)峰值,在143bp以下有10bp的周期性,被保存下來;然而,不大于150bp的片段的比例增加,具有CCCA末端基序的讀數(shù)比例也顯著增加。
腫瘤來源的cfDNA分子確實(shí)富含末端選擇。僅基于5'末端的末端選擇或使用補(bǔ)充核小體軌道,顯示出一致的結(jié)果。
末端選擇的cfDNA片段組學(xué)的改變
通過機(jī)器學(xué)習(xí)提高診斷性能
03
對(duì)于每個(gè)樣本,團(tuán)隊(duì)計(jì)算了每個(gè)窗口的N指數(shù)值,然后采用梯度提升決策樹(GBDT)算法,利用N指數(shù)值來區(qū)分癌癥患者和對(duì)照組。團(tuán)隊(duì)將這種方法命名為EXCEL(末端選擇檢查cfDNA),它生成了帶有分?jǐn)?shù)的模型,以對(duì)樣本是否癌變進(jìn)行分類。每5Mb窗口N指數(shù)值的EXCEL模型顯示,總體AUC值為0.95,并且顯著高于全基因組N指數(shù)指標(biāo)。所有癌癥和分期的AUC,至少為0.92。此外,EXCEL在181名癌癥患者中,檢測(cè)到154名患者。敏感性為85.1%,特異性為95%,高于同一數(shù)據(jù)集上的DELFI算法(79.8%);同樣,對(duì)可切除(I-III 期)腫瘤患者的敏感性為84.8%,也高于DELFI(79.2%)。在區(qū)分癌癥樣本與對(duì)照組時(shí),總體AUC值分別為0.88和0.81,這明顯高于沒有使用機(jī)器學(xué)習(xí)的全基因組指標(biāo)。
使用EXCEL進(jìn)行癌癥診斷
總結(jié)
04
1. N指數(shù)值的意義:N指數(shù)值反映了腫瘤DNA分?jǐn)?shù)的升高,表明末端選擇可以富集腫瘤來源的cfDNA。
2. 生物標(biāo)志物的潛力:N指數(shù)、ΔS150值和ΔMCCCA指標(biāo),是泛癌診斷的有前途的生物標(biāo)志物。
3. 末端選擇的重要性:末端選擇可以富集腫瘤來源的cfDNA分子,恢復(fù)大量讀數(shù)用于下游分析。
4. 診斷性能的提升:結(jié)合機(jī)器學(xué)習(xí)方法,這些指標(biāo)可以顯著提高泛癌患者的診斷性能。
5. 未來應(yīng)用的展望:這些指標(biāo)可以作為構(gòu)建大型多生物標(biāo)志物、高性能診斷模型的寶貴元素。