英國(guó)計(jì)劃到2017年對(duì)10萬人進(jìn)行基因組測(cè)序(圖片來源:Sergey Nivens)
美國(guó)加州一對(duì)龍鳳胎出生后,他們的父母非常憂慮:兩個(gè)嬰兒不僅發(fā)育緩慢,而且肌肉松軟無力。大腦掃描結(jié)果顯示,男嬰或存在大腦性麻痹;然而醫(yī)生對(duì)造成女嬰震顫和癲癇的原因卻不清楚。一連串的檢測(cè)均未能確診兩名嬰兒的病因,當(dāng)兩名孩子5歲時(shí),開始服用左旋多巴(用于治療帕金森氏癥的一種藥物)進(jìn)行治療,然而該藥物療效有限。
直到2010年,這對(duì)雙胞胎14歲后,全基因測(cè)序才結(jié)束了他們的病因診斷之旅。測(cè)序結(jié)果發(fā)現(xiàn),參與墨蝶呤還原酶(這種酶參與生成神經(jīng)遞質(zhì)多巴胺和5-羥色胺)基因編碼的一個(gè)基因產(chǎn)生了一對(duì)突變。醫(yī)生在臨床治療中加入了5-羥色胺之后,男孩的運(yùn)動(dòng)能力增強(qiáng)了,女孩也不再受到突然的、讓人喘不過氣的痙攣的折磨了。
國(guó)家基因工程
類似的病例激發(fā)了科學(xué)家進(jìn)一步探索基因療法的雄心。實(shí)際上,由于基因測(cè)序可以探查到與特定疾病相關(guān)的基因,該療法正在成為一種日益受歡迎的診斷方法。但這種測(cè)序通常很難給出診斷結(jié)果,因?yàn)樗鼈兺劢褂诓糠只蚪M序列的已知基因。諸如上述雙胞胎案例,研究人員和臨床醫(yī)生需要進(jìn)一步對(duì)一個(gè)人的全基因組序列進(jìn)行檢測(cè),才能發(fā)現(xiàn)致病基因。當(dāng)前,全基因組測(cè)序僅用于個(gè)別案例,但是許多大規(guī)模計(jì)劃正考慮把全基因組分析納入常規(guī)醫(yī)療保健體系。
英國(guó)就是其一。通過10萬人基因組計(jì)劃(該項(xiàng)計(jì)劃于2012年發(fā)起,并得到首相戴維·卡梅倫的支持),該國(guó)已經(jīng)在基因醫(yī)學(xué)方面邁出了一大步。
作為3億英鎊計(jì)劃的一部分,10萬人基因組計(jì)劃到2017年將對(duì)被納入英國(guó)國(guó)家醫(yī)療服務(wù)系統(tǒng)(NHS)的10萬名癌癥患者、罕見病患者以及傳染病患者進(jìn)行全基因組測(cè)序。該計(jì)劃的目標(biāo)是通過把疾病和精確的基因特征相關(guān)聯(lián),從而根據(jù)患者的個(gè)體需求提供精準(zhǔn)治療,最終刺激英國(guó)基因組學(xué)產(chǎn)業(yè)的發(fā)展。
由國(guó)家資助的、一體化的英國(guó)醫(yī)療衛(wèi)生系統(tǒng)對(duì)于開展如此大規(guī)模的基因醫(yī)學(xué)研究非常理想,牛津大學(xué)醫(yī)學(xué)研究專家John Bell說,他也是基因組學(xué)英格蘭公司的理事之一,該公司是NHS下屬的一家旨在管理和運(yùn)行10萬人基因組計(jì)劃的公司。NHS已經(jīng)擁有大量個(gè)人臨床信息,把這些信息和詳細(xì)的基因組數(shù)據(jù)結(jié)合,將更有利于在醫(yī)學(xué)和基因之間的聯(lián)系上獲得重要發(fā)現(xiàn)?,F(xiàn)在,證明全基因組分析有助于診斷疾病的證據(jù)已經(jīng)越來越多,長(zhǎng)遠(yuǎn)來看,這項(xiàng)計(jì)劃的目標(biāo)是讓全基因組成為NHS常規(guī)記錄的一部分,Bell說。
然而,在實(shí)現(xiàn)這一愿景之前,10萬人基因測(cè)序計(jì)劃仍須跨越一些障礙。除了提取和測(cè)序大量個(gè)人基因的煩瑣任務(wù)外,還存在辨別哪些基因突變會(huì)導(dǎo)致疾病、哪些突變是有害的等諸多問題,回答這些問題將需要處理海量數(shù)據(jù),且耗時(shí)漫長(zhǎng),因此也需要專業(yè)公司設(shè)計(jì)出更先進(jìn)的軟件。
發(fā)展勢(shì)頭強(qiáng)勁
冰島是首個(gè)對(duì)其公民實(shí)施大規(guī)?;蚍治鲇?jì)劃的國(guó)家。很多國(guó)家隨后也開展了同樣有著明確目標(biāo)的計(jì)劃:把公民健康和基因組測(cè)序相聯(lián)系。在美國(guó),“精準(zhǔn)醫(yī)學(xué)計(jì)劃”打算對(duì)100萬名志愿者進(jìn)行基因測(cè)序,而正在醞釀的“百萬老兵計(jì)劃”目標(biāo)也是在美國(guó)退伍軍人之間開展類似的計(jì)劃。其他正在進(jìn)行類似項(xiàng)目的國(guó)家還包括加拿大、澳大利亞、日本、韓國(guó)、新華坡、泰國(guó)、科威特、卡塔爾、以色列、比利時(shí)、盧森堡和愛沙尼亞。
但英國(guó)的10萬人基因工程發(fā)展勢(shì)頭最為強(qiáng)勁,該工程已經(jīng)注冊(cè)了3500名罕見病患者、2000名癌癥患者,該工程共計(jì)劃招募約7.5萬人。最終招募的罕見病患者與其親屬將包括5萬人,由于80%的罕見病會(huì)遺傳,所以該項(xiàng)目將會(huì)對(duì)罕見病遺傳者(通常是孩子)和與血緣關(guān)系最近的親屬進(jìn)行基因組測(cè)序。其他的2.5萬人將包括癌癥患者,他們的基因組序列將會(huì)進(jìn)行兩次檢測(cè)(腫瘤DNA將會(huì)被用于和該患者的正常細(xì)胞作對(duì)比),從而讓測(cè)序總量達(dá)到10萬人次。
該項(xiàng)目的目標(biāo)是,希望可以讓參試者受益于臨床分析,而且他們的基因組數(shù)據(jù)還會(huì)對(duì)全社會(huì)的患者貢獻(xiàn)價(jià)值。比如,醫(yī)生通過把一名患者的前列腺癌癥基因和英國(guó)基因數(shù)據(jù)庫(kù)中的數(shù)據(jù)作對(duì)比,可能揭示出該病背后的具體基因模式。醫(yī)生可能會(huì)找出具有同樣基因模型的其他患者,然后了解哪些藥物和程序?qū)颊哂幸妗?/p>
尋找合作伙伴
現(xiàn)在,基因組學(xué)英格蘭公司正在為基因檢測(cè)過程中的各個(gè)步驟——從提取DNA樣本到分析基因組——尋找行業(yè)合伙人,總部位于加州圣迭戈的測(cè)序設(shè)備生產(chǎn)商Illumina公司就是合作者之一,該公司正在進(jìn)行基因測(cè)序以及區(qū)分基因變異(即識(shí)別變體)等工作。該公司目前仍在位于英國(guó)小切斯特福德的分公司從事這項(xiàng)工作,但隨著該項(xiàng)目規(guī)模日益擴(kuò)大,未來數(shù)月,相關(guān)測(cè)序儀器將會(huì)被運(yùn)往欣克斯頓威康信托基金會(huì)基因組校園。
Illumina正在利用高通量測(cè)序處理提取的DNA樣本,以獲得As、Ts、 Cs和Gs等DNA構(gòu)建模塊短片段的字符串。這些片段會(huì)通過運(yùn)算被組合成一個(gè)一個(gè)連續(xù)的序列,然后科學(xué)家會(huì)通過生物信息學(xué)把這些生成的全基因組和人類參照基因組(由國(guó)際基因組參照序列合作體持續(xù)更新的一個(gè)人類基因組的典型范例)進(jìn)行對(duì)比。其目的是發(fā)現(xiàn)和這個(gè)范例不同的每一處偏離:即每個(gè)基因變異。
為了識(shí)別這些變異,Illumina團(tuán)隊(duì)將使用該公司的艾薩克工作流—— 一種計(jì)算基因序列和識(shí)別變體工具的開放源代碼——辨別每個(gè)基因組潛在的成千上萬個(gè)變異中哪種變異與個(gè)體疾病相關(guān)聯(lián)?;蚪M學(xué)英格蘭公司將會(huì)對(duì)位于科舍姆安全數(shù)據(jù)中心的全部10萬份基因組樣本的序列和變異進(jìn)行收集與分析。但是這家NHS下屬的公司還要決定在這一過程中采用哪些軟件:在選擇最終用于該計(jì)劃的軟件之前,該公司將和Illumina等科研機(jī)構(gòu)合作,以驗(yàn)證、測(cè)試以及提高現(xiàn)存的許多變體識(shí)別算術(shù)公式。
當(dāng)前,Illumima公司已經(jīng)對(duì)10萬人基因工程中的3000多個(gè)基因組進(jìn)行了測(cè)序,現(xiàn)在每天仍在進(jìn)行更多的測(cè)序工作。“對(duì)于各種分析結(jié)果,公司將會(huì)收集和報(bào)告在DNA具體部位發(fā)現(xiàn)的不同種類的胚胎和體細(xì)胞變異。”該公司人口測(cè)序計(jì)劃執(zhí)行經(jīng)理Peter Fromen說。這些變異可能包括插入或刪除部分核苷酸,或是用一種核苷酸替代另一種核苷酸。此外還包括結(jié)構(gòu)變異,比如一個(gè)基因復(fù)制數(shù)量的變化。
亟待軟件創(chuàng)新
在此項(xiàng)工程中,每個(gè)變異都會(huì)被拿來和現(xiàn)有變異數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行對(duì)比,這些數(shù)據(jù)庫(kù)包括諸如核苷酸多態(tài)性數(shù)據(jù)庫(kù)(dbSNP);美國(guó)國(guó)立衛(wèi)生研究院下屬的一個(gè)短基因變異數(shù)據(jù)庫(kù);編纂了全球人類基因變異目錄的國(guó)際研究計(jì)劃;外顯子組聚集聯(lián)盟(ExAC)數(shù)據(jù)庫(kù);外顯子組測(cè)序數(shù)據(jù)集等。由于該工程工作量極大,參與考量的10家最頂尖的公司將負(fù)責(zé)為該項(xiàng)目的首批8000名患者提供評(píng)注以及解釋類的服務(wù)工作。目前基因組學(xué)英格蘭公司已經(jīng)把中標(biāo)公司縮減到了其中的4家,并要求這些公司通過相關(guān)測(cè)試階段,并達(dá)成一項(xiàng)協(xié)議。
據(jù)悉,劍橋的Congenica和加州的Omicia公司將分析罕見病基因;加州的Nanthealth公司將分析癌癥基因;馬薩諸塞州坎布里奇市的WuXi NextCODE公司將分析癌癥和罕見病兩者。加州圣迭戈的Cypher Genomics公司和與其合作的馬里蘭州的Lockheed Martin公司將成為保留的候選公司。這些公司此前均有相關(guān)領(lǐng)域的工作經(jīng)驗(yàn)。
這些公司都將使用高性能計(jì)算機(jī)解釋基因數(shù)據(jù),并將在基因組學(xué)英格蘭公司的安全數(shù)據(jù)中心工作,對(duì)數(shù)據(jù)進(jìn)行分析。它們的宗旨是提供自動(dòng)化服務(wù),因?yàn)楫?dāng)前解釋下一代測(cè)序數(shù)據(jù)在很大程度上仍要采取手動(dòng)程序,這一過程須耗費(fèi)大量時(shí)間。因此,每個(gè)公司都會(huì)帶來其自有的、不同的專業(yè)知識(shí)和經(jīng)驗(yàn),以處理這些棘手的解讀問題。
NHS并不擅長(zhǎng)技術(shù)創(chuàng)新,Bell說,但基因組學(xué)英格蘭公司在這一方面具備改革能力。對(duì)該公司來說,整個(gè)10萬人基因組計(jì)劃的目的是為臨床醫(yī)學(xué)提供答案。但是在診斷資料解析抵達(dá)醫(yī)生和患者之前,科學(xué)家團(tuán)隊(duì)和臨床醫(yī)師需要分析這些數(shù)據(jù)。目前,10萬人基因組工程已經(jīng)進(jìn)行了一系列活動(dòng),這對(duì)全基因組學(xué)領(lǐng)域的發(fā)展可能是有力的促進(jìn)因素。它將會(huì)帶來許多商業(yè)和學(xué)術(shù)機(jī)遇,可能會(huì)讓基因醫(yī)學(xué)最終實(shí)現(xiàn)其眾望所歸的前景,為受疾病折磨的患者帶來益處。