一對(duì)加利福利亞雙胞胎出生后,他們的父母日益憂心:寶寶們發(fā)育緩慢,而且肌張力低。腦部掃描發(fā)現(xiàn),男寶寶可能有大腦麻痹,但女寶寶卻有癲癇和震顫。醫(yī)生們百思不解。多種測(cè)試結(jié)果都無法確診兩個(gè)寶寶究竟出了什么問題。等到孩子們5歲的時(shí)候,使用左旋多巴胺——一種帕金森病藥物,療效也非常短暫。
2010年,這對(duì)雙胞胎14歲了,全基因組篩查終于揭開了謎題。雙胞胎編碼墨蝶呤還原酶(sepiapterin reductase,一種在神經(jīng)遞質(zhì)多巴胺和5-羥色胺合成中起作用的酶)的基因存在缺陷。醫(yī)生因此改變了治療方案,增加了5-羥色胺的服用。男孩子的行動(dòng)能力有所加強(qiáng),女孩也不再出現(xiàn)突發(fā)性抽搐了。
這樣的故事激起了學(xué)界人士使用基因篩查作為診斷工具的興趣。確實(shí),如果檢查能篩出疾病相關(guān)的基因突變,這樣治療就更加有的放矢。
但這樣的基因測(cè)試通常不能為診斷提供多少依據(jù),因?yàn)槟壳暗幕驕y(cè)試聚焦于在特定染色體上的特定基因。在類似于雙胞胎的案例中,研究者們不得不篩查所有基因,來尋找致病基因。就目前來說,這種檢驗(yàn)非常稀少。但一些大規(guī)模的研究項(xiàng)目正準(zhǔn)備把全基因組篩查加入到常規(guī)醫(yī)學(xué)診斷中。
英國對(duì)于基因組醫(yī)學(xué)壯志滿懷,啟動(dòng)了10萬人基因組計(jì)劃。該計(jì)劃由12年開始,贏得了英國首相David Cameron的個(gè)人支持。該計(jì)劃投資3億英鎊,對(duì)英國國民健康服務(wù)中心(National Health Service, NHS)的癌癥、少見疾病和傳染性疾病病人進(jìn)行測(cè)序。該計(jì)劃旨在尋找疾病的致病基因,為臨床提供更好的診斷工具,為病人提供個(gè)性化治療,最終促進(jìn)英國基因產(chǎn)業(yè)。
John Bell認(rèn)為,英國衛(wèi)生醫(yī)療系統(tǒng)是國家資金支持的,因此非常適合執(zhí)行這種大規(guī)模的基因組醫(yī)學(xué)實(shí)驗(yàn)。Bell是牛津大學(xué)(University of Oxford)的醫(yī)學(xué)研究者,同時(shí)也是Genomic England公司的董事。Genomic England是英國國民健康服務(wù)中心附屬的一家公司,是10萬人基因組計(jì)劃的主要實(shí)施公司。NHS有非常詳細(xì)的病人信息,將這些與基因篩查結(jié)果聯(lián)系起來,能更清楚地認(rèn)識(shí)到疾病和基因之間的聯(lián)系。Bell指出,多種證據(jù)表明,全基因組篩查能夠幫助診斷和治療多種疾病,NHS希望能把全基因組篩查作為常規(guī)醫(yī)學(xué)手段。
但在這個(gè)目標(biāo)實(shí)現(xiàn)以前,10萬人基因組計(jì)劃必須克服幾個(gè)問題。從這么多人身上提取DNA樣本本身就是一件繁瑣的事情,除此之外,確定哪些基因突變是致病的,哪些是無害的也是一件棘手的事情。這需要大量的數(shù)據(jù)、時(shí)間,還需要專門的軟件來干這些事情。
支持者眾多
冰島是第一個(gè)啟動(dòng)大規(guī)模全基因組分析計(jì)劃的國家。很多國家也抱著將疾病和基因聯(lián)系在一起的美好愿景,加入到了基因組篩查的隊(duì)伍中。在美國,精準(zhǔn)醫(yī)療計(jì)劃打算測(cè)試100萬志愿者的基因組,而百萬老兵項(xiàng)目則計(jì)劃對(duì)百萬名老兵進(jìn)行基因測(cè)序。而其他多個(gè)國家,包括加拿大、澳大利亞、日本、韓國、新加坡、泰國、以色列、科威特、卡塔爾、比利時(shí)、愛森堡和愛沙尼亞也紛紛開展基因篩查項(xiàng)目。
但英國的10萬人基因組計(jì)劃看起來最有希望:它已經(jīng)成功募集了3500名罕見疾病患者和2000個(gè)癌癥病人,未來只需要找到75000名志愿者(其實(shí)基本都是這些患者的親屬)就夠了。罕見疾病患者和他們的家人最后會(huì)有5萬人。80%的罕見疾病是家族遺傳的,因此受影響者(通常是兒童)的基因可以和他血緣最近的親屬的結(jié)果進(jìn)行對(duì)比。癌癥病人及其家屬會(huì)組成另外的25000名志愿者。癌癥病人的基因組會(huì)測(cè)兩次,和父母的正常細(xì)胞進(jìn)行對(duì)比。因此,英國基本已經(jīng)找齊了他們所需的志愿者。
志愿者們希望,基因篩查結(jié)果能讓他們更清楚地了解自己的狀況。這些信息對(duì)于整個(gè)病人群體都有重要意義。一個(gè)前列腺癌患者的基因組,經(jīng)過與數(shù)據(jù)庫的對(duì)比,可以提供前列腺癌相關(guān)的基因信息。醫(yī)生從這個(gè)患者的治療中,了解到對(duì)于具有類似基因的患者采用哪種治療最為有效。
企業(yè)合作者
Genomics England現(xiàn)在正在挑選每一步(從提取DNA到解讀基因組)的企業(yè)合作者??偛吭谑サ貋喐绲臏y(cè)序儀器生產(chǎn)商Illumina負(fù)責(zé)測(cè)序工作,同時(shí)也負(fù)責(zé)鑒別基因突變。這由Illumina在英國小切斯特福德的分公司進(jìn)行。但在未來幾個(gè)月里,計(jì)劃開始擴(kuò)大范圍時(shí),Illumina計(jì)劃把測(cè)序儀器搬到英國斯頓的維康信托基因組園區(qū)(Wellcome Trust Genome Campus)。
Illumina通過高通量測(cè)序儀器處理提取的DNA樣本,獲得小段的堿基片段。這些片段通過電腦計(jì)算,重組成連續(xù)的序列,然后通過生物信息學(xué),科學(xué)家們會(huì)把生成的結(jié)果和人類參照基因組(由國際基因組參照協(xié)會(huì)(Genome Reference Consortium)不斷更新的人類代表性基因組)進(jìn)行對(duì)比,目的是發(fā)現(xiàn)和參照基因組不同的序列片段,也就是突變。
為了鑒別這些突變,Illumina團(tuán)隊(duì)使用該公司的Isacc工作流程(一種開源的計(jì)算基因組排布和識(shí)別變體的工具)。然后,為了鑒別每個(gè)基因組的幾百個(gè)變異中哪一個(gè)致病,Genomics England公司會(huì)在數(shù)據(jù)中心收集10萬人的基因信息,然后進(jìn)行分析。但Genomics England還沒有決定選擇哪個(gè)軟件來實(shí)施這一工作:需要和Illumina和學(xué)界一起檢驗(yàn)各個(gè)軟件的可靠性,然后改善現(xiàn)有的識(shí)別變體的算法,最后再確定選擇哪個(gè)軟件。
Illumina已經(jīng)對(duì)3000多個(gè)樣本進(jìn)行了測(cè)序,但每天有更多的樣本涌入。Peter Formen,Illumna10萬人基因組計(jì)劃的管理主任表示,針對(duì)突變分析,他們打算收集和上報(bào)生殖細(xì)胞和體細(xì)胞NDA中特定位點(diǎn)的的多種變體。變體包括增加或缺少幾個(gè)核苷酸,或是以一種核苷酸替代了另一種。也可能有結(jié)構(gòu)性的變體,例如一個(gè)基因拷貝數(shù)變異。
緊接著,每個(gè)變體和已有的變體數(shù)據(jù)庫,例如dbSNP庫(一個(gè)由美國國立衛(wèi)生研究院(NIH)建立的,針對(duì)短基因突變的數(shù)據(jù)庫)進(jìn)行對(duì)比。類似的數(shù)據(jù)庫還有很多,包括:全球千人基因組計(jì)劃也建立了全球人類基因變異的目錄;Exome Aggregation Consortium (ExAC),一個(gè)外顯子測(cè)序數(shù)據(jù)庫(外顯子是負(fù)責(zé)編碼蛋白的全部DNA序列);以及ClinVar,NIH建立的變異與相關(guān)生理狀況的數(shù)據(jù)庫。發(fā)現(xiàn)這些變體的作用是下個(gè)階段的任務(wù),各個(gè)公司都踴躍申請(qǐng)承擔(dān)這項(xiàng)任務(wù)。2014年春天,Genomics England對(duì)全球的基因組階段專家進(jìn)行了評(píng)價(jià)。28家參評(píng)公司需要對(duì)15個(gè)罕見疾病患者和兩個(gè)健康人的基因,以及同一個(gè)病人的10個(gè)腫瘤DNA和正常DNA進(jìn)行分析,然后給出變異注解(確定基因和其蛋白產(chǎn)物)和解讀(把基因、蛋白和功能聯(lián)系在一起)。
表現(xiàn)最佳的公司可以接受一個(gè)測(cè)試,為8000個(gè)志愿者進(jìn)行基因組解讀的工作。Genomics England從28家公司中挑出了表現(xiàn)最佳的4家,這4家需要通過這個(gè)測(cè)試,并簽訂協(xié)議。這四家公司分別是英國劍橋的Congenica和美國加利福利亞的Omicia,他們會(huì)分析罕見疾病患者的基因組;加利福利亞的Nanthealth,他們會(huì)分析癌癥基因;麻省的Wuxi NextCode公司,他們既要分析罕見疾病又要分析癌癥。圣地亞哥的Cypher Genomics公司及其合作伙伴高級(jí)技術(shù)和防衛(wèi)公司Lockheed Martin則是候選公司。這些公司此前都有相關(guān)領(lǐng)域的從業(yè)經(jīng)驗(yàn)。
所有公司都會(huì)使用高效能計(jì)算來解讀基因數(shù)據(jù),并且工作場(chǎng)所都是Genomics England的安全數(shù)據(jù)中心。目的是提供幾乎全自動(dòng)的服務(wù)——解讀下一代測(cè)序數(shù)據(jù)目前主要是人工操作,需要花費(fèi)數(shù)小時(shí)到數(shù)周的時(shí)間。據(jù)Genomics England生物信息部門的領(lǐng)導(dǎo)Augusto Rendon表示,最忙的時(shí)候,每天有200多個(gè)基因組的數(shù)據(jù)需要處理。如果要按時(shí)地、不超預(yù)算地完成計(jì)劃,如果想把全基因組測(cè)序作為常規(guī)診療手段,那么人工解讀必然無法達(dá)到要求。
花落誰家
每個(gè)公司都帶來了自己的專家團(tuán)隊(duì)來完成基因組解讀任務(wù)。Congenica,是維康信托桑格研究所(Wellcome Trust Sanger Institute)和英國衛(wèi)生部(Wellcome Trust Sanger Institute)的下屬公司,之前一直為NHS提供測(cè)序服務(wù)。它會(huì)分析疾病相關(guān)的遺傳性和獲得性的稀有基因突變。它開發(fā)的Sapientia平臺(tái)已經(jīng)在“解密發(fā)育疾病項(xiàng)目”(Deciphering Developmental Disorders, DDD)中投入使用,對(duì)12000名兒童進(jìn)行基因測(cè)序。DDD是迄今為止全世界最大規(guī)模的、全國性的、罕見疾病測(cè)序項(xiàng)目。Congenicad 首席運(yùn)營官Tom Weaver表示,這項(xiàng)研究對(duì)30%-40%的參與兒童做出了診斷,這些兒童患有無法確診的出生缺陷或認(rèn)知缺陷。
美國的Omicia公司在基因組的臨床解讀上也有很多經(jīng)驗(yàn),但它之前使用的是開放源碼、開放獲取的工具。在10萬人基因組計(jì)劃中,它將會(huì)使用Opal的基因解讀軟件,來預(yù)測(cè)哪個(gè)變體可能導(dǎo)致疾病。該公司的Phevor算法(表型驅(qū)動(dòng)編譯本體論重排序工具)能把突變可能與疾病相關(guān)的概率,與基因功能現(xiàn)行和信息的數(shù)據(jù)庫相結(jié)合。Omicia可利用這一工具將病人的表型(也就是病理表現(xiàn))也結(jié)合起來。Omicia的首席科學(xué)家Martin Reese表示,這些高度自動(dòng)化的工具意味著,Omicia可以避免人工解讀信息。這些算法能夠把變體歸類到已知的致病基因中,這些基因與疾病的聯(lián)系部分已知,部分仍待證實(shí)。隨后Opal會(huì)把這些結(jié)果整合在一起,匯總成報(bào)告,幫助醫(yī)生形成治療意見。
Cypher Genomics是斯克里普斯研究所(Scripps Research Institute)的下屬公司,開發(fā)過Mantis基因解讀軟件。Mantis能夠根據(jù)變體致病的概率進(jìn)行排序。Cypher Genomics的首席運(yùn)營官Adam Simpson表示,根據(jù)Mantis的分析結(jié)果,科學(xué)家們可以優(yōu)先選擇研究的變體對(duì)象。
最后要談到Wuxi NextCode公司了。Wuxi NextCode是冰島基因公司deCODE的衍生公司。deCODE由Kari Stefansson于1996年創(chuàng)立。Kari Stefansson率先提出,獲取全國人民的基因信息,來尋找致病基因的理念。后來deCODE被制藥公司Amgen收購時(shí),一幫生信學(xué)家和deCODE的前職工創(chuàng)立了Wuxi NextCode。Wuxi NextCODE在2015年1月被中國上海藥明康德公司收購。
Wuxi NextCode的結(jié)果并不是一張可能引起疾病的突變清單。Wuxi NextCode的首席科學(xué)家Jeff Gulcher表示,全球的臨床醫(yī)生和研究人員都可以通過任何網(wǎng)絡(luò)瀏覽器,在單個(gè)堿基分辨率上實(shí)時(shí)存儲(chǔ)、查看和分析基因數(shù)據(jù),并且軟件不斷更新最新的變異信息。
Gulcher表示,一個(gè)典型的問題可能是“我想知道,這到底是不是變異”。這意味著,需要尋找患有相同罕見疾病的個(gè)體,看看他是否也有相同的突變體??傆幸惶欤t(yī)生可能想知道癌癥病人是否有類似的變體和病程發(fā)展,同時(shí)想了解過去十年的此類病人采用的治療。Gulcher表示,Wuxi NextCODE的Genomically Ordered Rela -tional Database數(shù)據(jù)庫可以完美地實(shí)現(xiàn)這類需求。
另一方面,基因?qū)W家可能需要比較20個(gè)基因組,每個(gè)有一百萬個(gè)變體。他需要知道的是,哪個(gè)是致病變體。Wuxi NextCODE的數(shù)據(jù)庫根據(jù)基因位置來顯示變體,從而不需要對(duì)所有基因從頭到尾進(jìn)行比較分析,提高處理效率。Wuxi NextCode的首席運(yùn)營官Hannes Smarason表示,該平臺(tái)非常適應(yīng)處理大量信息,例如30萬冰島人的基因組信息。
Nanthealth是私營企業(yè),主攻癌癥基因組信息的計(jì)算分析,為臨床治療提供指導(dǎo)。Nanthealth拒絕提供信息,但它的主頁上顯示,該公司分析了超過2萬個(gè)基因樣本。該公司由醫(yī)生和生物醫(yī)學(xué)研究者Patrick Soon-Shiong創(chuàng)立。Patrick Soon-Shiong還是一個(gè)基金會(huì)的主席,該基金會(huì)致力于消除醫(yī)療資源不平等,并支持研究。同時(shí)他還是一個(gè)非營利性研究機(jī)構(gòu)的負(fù)責(zé)人,該研究結(jié)構(gòu)致力于促進(jìn)電子分子診斷。他研發(fā)了抗癌藥物Abraxane,該藥物能夠治療多種癌癥。
對(duì)于Genomics England來說,整個(gè)項(xiàng)目旨在為臨床提供指導(dǎo)。但在把結(jié)果反饋給醫(yī)生和家屬之前,科學(xué)家和醫(yī)生們需要先仔細(xì)研究這些數(shù)據(jù)。Genomics England 募集了2000名專攻13種罕見疾病和10種癌癥的醫(yī)生和科學(xué)家,來完成質(zhì)量檢驗(yàn)工作。同時(shí)他們也需要研究項(xiàng)目成果,特別是審查基因和疾病的聯(lián)系是否明確。他們會(huì)通過細(xì)胞檢驗(yàn)和小鼠實(shí)驗(yàn)來研究變體是如何影響和誘發(fā)疾病的,這些信息都會(huì)匯總到10萬人基因組計(jì)劃。一些結(jié)果可通過數(shù)據(jù)庫很快證實(shí),而另一些結(jié)果則需要通過文獻(xiàn)、軟件和實(shí)驗(yàn)來謹(jǐn)慎驗(yàn)證。
Bell表示,NHS并不以技術(shù)創(chuàng)新出名,但Genomics England可能會(huì)改變這一形象。10萬人基因組計(jì)劃對(duì)整個(gè)基因領(lǐng)域造成了重大影響。它將提供很多商業(yè)和學(xué)術(shù)機(jī)會(huì),甚至有可能實(shí)現(xiàn)將基因組運(yùn)用到臨床上,從而造福全人類的偉大目標(biāo)。
原文檢索:
Vivien Marx. (2015) The DNA of a nation. Nature, 524(7565): 503-505.