大數(shù)據(jù)時代已經(jīng)來臨。2014財年,美國政府就如何充分利用生物醫(yī)學大數(shù)據(jù),啟動Big Data to Knowledge計劃,這是繼2012年美國國家大數(shù)據(jù)計劃實施后新一輪面向生物大數(shù)據(jù)的基礎研究計劃。目前,發(fā)達國家在生物大數(shù)據(jù)領域的技術和應用已遠遠走在前端。在我國,生物大數(shù)據(jù)還處于發(fā)展的初期階段。該如何以最快的速度趕上這一潮流,如何從國家主權層面對生物大數(shù)據(jù)進行有效的保護和管理,如何在基礎研究和技術市場應用上與世界同步,已成為不可回避且值得深入思考的話題。
誰是生物大數(shù)據(jù)技術的領航者
大數(shù)據(jù)發(fā)展的核心動力來自于人類記錄、測量和分析世界的渴望。當前,高通量測序技術的快速發(fā)展,使生命科學研究獲得了強大的數(shù)據(jù)產(chǎn)生能力。
哈爾濱工業(yè)大學計算機科學與技術學院院長王亞東教授告訴科技日報記者,上世紀90年代,科學家花費10年時間、近30億美元獲得了第一個人類基因組圖譜;而今天,完成一個個人基因組測序不到一天時間,費用低于1000美元。
自人類基因組計劃完成以來,以美國為代表,世界主要發(fā)達國家紛紛啟動了生命科學基礎研究計劃,如國際千人基因組計劃、DNA百科全書計劃、英國十萬人基因組計劃等。這些計劃引領生物數(shù)據(jù)呈爆炸式增長,目前每年全球產(chǎn)生的生物數(shù)據(jù)總量已達EB級,生命科學領域正在爆發(fā)一次數(shù)據(jù)革命,生命科學某種程度上已經(jīng)成為大數(shù)據(jù)科學。
“這還只是剛剛開始”,王亞東強調(diào),“隨著測序技術在醫(yī)療、健康、醫(yī)藥、環(huán)境、能源等相關領域的廣泛應用,人類將面臨生物數(shù)據(jù)的海洋,其將成為這些領域創(chuàng)新的源泉,對這些數(shù)據(jù)創(chuàng)新性的管理和應用,將為生命科學及相關產(chǎn)業(yè)領域帶來一次新的革命?!?
與全球蒸蒸日上的生物大數(shù)據(jù)創(chuàng)新發(fā)展熱潮相比,中國的研發(fā)及應用才拉開帷幕?!拔覀兣c國際前沿技術水平至少相差30年,差距主要表現(xiàn)在數(shù)據(jù)分析、數(shù)據(jù)管理和與臨床的應用對接上”,上海生物信息技術研究中心主任李亦學研究員對此深表擔憂。
李亦學分析認為,我國有四大方面非常欠缺:其一,國內(nèi)現(xiàn)有的生物大數(shù)據(jù)分析能力雖然與歐美相差不大,但是在數(shù)據(jù)分析構架、軟件系統(tǒng)與先進的IT技術接軌上有待提升。其二,國外在生物大數(shù)據(jù)領域的領先人才多,盡管我們也有國際頂級刊物上發(fā)表的論文和成果,總體而言,國內(nèi)高水準團隊還是少。其三,歐美講求成果應用,層出不窮的分析軟件可被實驗室、臨床、產(chǎn)業(yè)多方應用。其四,在生物大數(shù)據(jù)理論研究、標準制定和廣泛應用上,中國都亟待全面跟進。
誰將引領生物大數(shù)據(jù)應用的市場和資源
對生物大數(shù)據(jù)的有效管理和利用,發(fā)達國家很早就開始了競爭。早在上世紀80—90年代,美國、歐洲和日本即已分別建立世界三大生物數(shù)據(jù)中心:美國國家生物技術信息中心(NCBI)、歐洲生物信息研究所(EBI)和日本DNA數(shù)據(jù)庫(DDBJ)。
王亞東強調(diào),“這三大生物數(shù)據(jù)中心掌握并管理著全世界的生物數(shù)據(jù)和知識資源,并處于壟斷地位?!?
美國國立衛(wèi)生研究院(NIH)建立了8個國家級生物數(shù)據(jù)技術研究中心,旨在長期發(fā)展生物大數(shù)據(jù)分析技術,提高生物大數(shù)據(jù)利用和轉(zhuǎn)化能力,并保持其領先地位。王亞東進一步指出,美國政府于近兩年兩次啟動生物大數(shù)據(jù)研究計劃,目的是有針對性地研究生物大數(shù)據(jù)管理、分析、共享等生物領域迫切需要的核心技術,從根本上提升美國利用生物大數(shù)據(jù)的水平,并以此帶動生物領域研究與產(chǎn)業(yè)發(fā)展。
在商業(yè)領域,生物大數(shù)據(jù)的應用市場也如雨后春筍,目前,一些公司已開始提供生物大數(shù)據(jù)服務。例如,谷歌投資DNANexus公司,提供生物大數(shù)據(jù)管理和分析服務,并于2011年接管NCBI數(shù)據(jù);早在2006年,23AndMe公司就開始提供個人基因組數(shù)據(jù)分析服務,目前其受益者總數(shù)已超過50萬人;英國衛(wèi)生部于2013年專門建立了Gel公司,管理和分析英國十萬人基因組計劃產(chǎn)生的基因組數(shù)據(jù)。
BCC報告指出:“至2018年,生物大數(shù)據(jù)的市場總額將增長至76億美元,年復合增長率達到71.6%?!丙溈襄a公司報告指出:“如果美國醫(yī)療保健行業(yè)有效利用大數(shù)據(jù),就能把成本降低8%左右,從而每年創(chuàng)造出超過3000億美元的產(chǎn)值?!?
誰來掌控我國生物大數(shù)據(jù)主權
對于一個國家而言,重要領域的大數(shù)據(jù)已成為戰(zhàn)略資源,擁有數(shù)據(jù)的規(guī)模和運用數(shù)據(jù)的能力將成為一個國家綜合國力的重要標志。
我國人口居世界首位,生物樣本資源豐富,這將使我國很快成為生物數(shù)據(jù)產(chǎn)出大國,但目前還不是生物大數(shù)據(jù)利用強國。
事實上,國際上生物數(shù)據(jù)資源一直掌握在歐美的幾大數(shù)據(jù)中心。我國產(chǎn)生的許多生物數(shù)據(jù)資源不得不提交到這些數(shù)據(jù)中心,導致我國投入大量資金與人力產(chǎn)生的生物數(shù)據(jù)嚴重流失。
在生物大數(shù)據(jù)領域,我國缺乏從國家層面對生物大數(shù)據(jù)進行有效管理與利用的體制、機制和環(huán)境,李亦學稱,“這已經(jīng)使中國的生物數(shù)字主權受到嚴重威脅”。
王亞東也強調(diào),“現(xiàn)在國際上的三大生物數(shù)據(jù)中心都是歐美國家層面建立的,并免費向國際開放。我國的相關科學研究和市場應用發(fā)展受益于這些數(shù)據(jù)中心,同時也嚴重依賴和受制于此?!?
業(yè)內(nèi)人士指出,我國尚未建立面向生物大數(shù)據(jù)技術發(fā)展的國家級技術研究中心,技術研發(fā)缺乏宏觀規(guī)劃和引導,技術產(chǎn)出較少,難以建立完善的生物大數(shù)據(jù)技術體系,不能滿足生物大數(shù)據(jù)發(fā)展面臨的數(shù)據(jù)管理和服務需求。同時,除了哈爾濱工業(yè)大學和上海生物信息技術中心等少數(shù)高校和研究所建立了生物大數(shù)據(jù)專業(yè)研究團隊外,人才缺口較大。
大數(shù)據(jù)的使用已經(jīng)成為一個國家各領域提高生產(chǎn)力、創(chuàng)新能力以及競爭力的關鍵要素。
專家們指出,生物大數(shù)據(jù)是國家戰(zhàn)略資源,對生物大數(shù)據(jù)資源的管理和利用應上升為國家意志,并考慮實施如下措施:建立國家生物大數(shù)據(jù)中心,保障我國數(shù)字主權,統(tǒng)籌管理和合理利用國家生物大數(shù)據(jù)戰(zhàn)略資源;通過國家科技政策,集中突破生物大數(shù)據(jù)核心技術,形成自主關鍵技術與系統(tǒng)產(chǎn)品,打破美歐技術限制;以現(xiàn)有優(yōu)勢學術和技術資源為基礎,建立國家級生物大數(shù)據(jù)研究機構,提升我國生物大數(shù)據(jù)技術和服務水平,并培養(yǎng)專業(yè)的生物大數(shù)據(jù)人才;強調(diào)應用需求牽引和政策支持,以加快生物大數(shù)據(jù)產(chǎn)業(yè)的全面發(fā)展。