在一項(xiàng)新的研究中,來(lái)自俄羅斯圣彼得堡國(guó)立大學(xué)的研究人員開(kāi)發(fā)出一種方法極大地改善人們對(duì)實(shí)驗(yàn)室中不能培養(yǎng)的有機(jī)體---如生活在人胃腸道中的微生物,或者生活在海洋深處的細(xì)菌---的DNA進(jìn)行測(cè)序的能力。相關(guān)研究結(jié)果于2016年2月1日在線發(fā)表在Nature Methods期刊上,論文標(biāo)題為“TruSPAdes: barcode assembly of TruSeq synthetic long reads”。
這種被稱作TruSPADES的方法通過(guò)計(jì)算機(jī)將來(lái)自Illumina公司的機(jī)器產(chǎn)生的長(zhǎng)300個(gè)堿基對(duì)的短測(cè)序片段(short reads)組裝成所謂的合成長(zhǎng)測(cè)序片段(synthetic long reads),這些合成長(zhǎng)測(cè)序片段是基因組中長(zhǎng)大約10,000個(gè)堿基對(duì)的片段。
研究人員說(shuō),使用這些合成長(zhǎng)測(cè)序片段而不是短測(cè)序片段組裝基因組就好比是使用整個(gè)章節(jié)而不是單個(gè)句子來(lái)組裝一本書(shū)。因此,人們有強(qiáng)烈的動(dòng)機(jī)利用長(zhǎng)測(cè)序片段改進(jìn)測(cè)序。
論文作者Pavel Pevzner教授說(shuō),“這是下一代測(cè)序技術(shù)。它將對(duì)宏基因組測(cè)序的操作應(yīng)用產(chǎn)生深刻影響。”
當(dāng)前,作為長(zhǎng)測(cè)序片段測(cè)序市場(chǎng)的佼佼者,Pacific Biosciences公司和Oxford Nanopore公司產(chǎn)生的長(zhǎng)測(cè)序片段是不準(zhǔn)確的,而且很難用于解決復(fù)雜的測(cè)序問(wèn)題,如組裝宏基因組(metagenome),其中宏基因組可以指的是從自然環(huán)境取樣的全部微生物的基因組,也可以指的是從自然環(huán)境取樣的全部微生物。相比之下,這種合成長(zhǎng)測(cè)序片段的準(zhǔn)確性提高了100倍,而且能夠大規(guī)模地快速產(chǎn)生從而覆蓋宏基因組中的大部分細(xì)菌。
為了開(kāi)發(fā)這種新的方法,研究人員獲取攜帶條形碼的長(zhǎng)100~300個(gè)堿基對(duì)的短測(cè)序片段。他們?nèi)缓罄靡环N在短測(cè)序片段測(cè)序(short read sequencing)中經(jīng)常使用的被稱作德布魯因圖(de Brujin graph)的方法描繪這些短測(cè)序片段,將它們組裝成合成長(zhǎng)測(cè)序片段。這種德布魯因圖允許研究人員確定哪些短測(cè)序片段連接在一起,從而組裝出更長(zhǎng)更準(zhǔn)確的合成長(zhǎng)測(cè)序片段。
接下來(lái)就是應(yīng)用這種方法研究包括從人微生物組到海洋微生物組在內(nèi)的多種微生物群落。Pevzner和另一名論文作者Anton Bankevich正在與來(lái)自美國(guó)克雷格文特爾研究所(J. Craig Venter Institute)的研究員Christopher Dupont合作開(kāi)展這方面的研究工作。
宏基因組學(xué)特別充滿挑戰(zhàn),這是因?yàn)檠芯咳藛T需要研究生活在一個(gè)微生物群落中的好幾百種細(xì)菌,而不能研究其中的單個(gè)細(xì)菌菌種。當(dāng)研究人員從這種微生物群落中提取樣品并進(jìn)行測(cè)序時(shí),他們獲得的是來(lái)自這個(gè)群落中所有細(xì)菌基因組的片段。這非常像是試圖拼出好幾百個(gè)拼圖,但是并不知道哪些拼板屬于哪個(gè)拼圖。TruSPADES方法和合成長(zhǎng)測(cè)序片段將有助研究人員拼出這些拼圖。
Dupont 說(shuō),“這種方法以更小的成本產(chǎn)生更好的結(jié)果。我們?nèi)缃裾诮M裝我們之前甚至還不知道它們存在的有機(jī)體的基因組。”