2012年4月24日,華大基因宣布其成功構(gòu)建了一個自主開發(fā)的云計算服務(wù)產(chǎn)品——EasyGenomicsTM。該產(chǎn)品旨在為“組學(xué)”研究領(lǐng)域的科研人員提供快捷、準(zhǔn)確和易于操作的新一代測序分析服務(wù),從而更好地應(yīng)對及解決海量生物信息數(shù)據(jù)的存儲、處理、計算和分析等問題。
以數(shù)據(jù)為驅(qū)動力的研究正引發(fā)著現(xiàn)代生命科學(xué)領(lǐng)域的巨大變革?!按髷?shù)據(jù)”(Big data)成為近期興起的一個熱點話題。它被一些科學(xué)家稱為“一種新型貨幣”和“一種新的石油”。美國總統(tǒng)奧巴馬于3月29日剛剛宣布了他的“大數(shù)據(jù)”計劃,并決定每年投資2億美元來資助“大數(shù)據(jù)”研究。由此可見“大數(shù)據(jù)”的重要性,與之相關(guān)的研究也迫在眉睫。
云計算則成為解決這一難題的強大利器。基于此,華大基因構(gòu)建了云計算平臺并成功推出了其首款云產(chǎn)品——EasyGenomics。該產(chǎn)品為一套操作簡單、靈活多樣、集存儲分析于一體的“一站式”自動化服務(wù)系統(tǒng)。據(jù)介紹,EasyGenomics主要集基因組學(xué)領(lǐng)域內(nèi)的常用的和華大基因特有的數(shù)據(jù)及參數(shù)為一體,結(jié)合云存儲和高性能計算技術(shù),能夠以更低的成本、更高的效率完成大量的數(shù)據(jù)處理及分析。
此外,EasyGenomics整合了Aspera公司的fasp™高速文件傳輸技術(shù),有效解決了“大基因數(shù)據(jù)”的傳輸瓶頸。EasyGenomics在各種共享和私有網(wǎng)絡(luò)環(huán)境中的數(shù)據(jù)傳輸速度比傳統(tǒng)傳輸方法提高了約10到100倍,極大地降低了數(shù)據(jù)傳輸?shù)某杀?,實現(xiàn)了基因組學(xué)測序數(shù)據(jù)的高效交流。
華大基因EasyGenomics產(chǎn)品主管何思飛表示:“Aspera是生命科學(xué)領(lǐng)域海量數(shù)據(jù)傳輸和管理的行業(yè)標(biāo)準(zhǔn),其卓越的數(shù)據(jù)傳輸速度、網(wǎng)絡(luò)帶寬管理以及可靠性,使得EasyGenomics能夠更加高效地進行大量基因數(shù)據(jù)的處理和分析?!?/P>
EasyGenomics精心部署及構(gòu)建了多項標(biāo)準(zhǔn)化生物信息分析流程及個性化比對、分析、注釋服務(wù)。目前,EasyGenomics支持的數(shù)據(jù)分析服務(wù)主要包括外顯子重測序(Exome Resequencing)分析、基因組重測序(Resequencing)分析、RNAseq分析、Small RNA分析,de novo基因組組裝等。該平臺可以為各大科研機構(gòu)和生物科技行業(yè)用戶提供高效數(shù)據(jù)傳輸、信息挖掘、生物信息分析等多種服務(wù)及創(chuàng)新解決方案。華大基因?qū)⒗^續(xù)完善EasyGenomics系統(tǒng),并在未來5年中推出系列基于生物云計算平臺的云產(chǎn)品,提供更多更豐富的生物信息分析服務(wù),進一步推動基因組學(xué)研究向應(yīng)用的轉(zhuǎn)化。
深圳華大基因研究院副院長方林指出:“目前,華大基因已經(jīng)擁有212 T Flops的峰值計算能力,總內(nèi)存容量已達到37.2 TB,總存儲能力已達到17 PB,此外,華大基因還在不斷提升其高性能計算能力,希望可以為基因組學(xué)研究帶來更多的創(chuàng)新解決方案。”
方林補充說:“我們的目標(biāo)是以更低的成本和更高的效率完成大量的生物信息數(shù)據(jù)處理。通過云計算平臺,全球的科研人員可以更加便捷地共享基因數(shù)據(jù)和軟件系統(tǒng),從而可以更好更快地開展各項研究工作,促進以基因信息為指導(dǎo)的臨床診斷和治療的貫穿應(yīng)用。”
為適應(yīng)更龐大數(shù)據(jù)存儲、處理、分析與應(yīng)用的要求,深圳華大基因研究院已和國家超算天津中心、深圳超算中心、廣州超算中心等機構(gòu)展開戰(zhàn)略性合作,旨在進一步提高基因組學(xué)相關(guān)技術(shù)的研發(fā)和應(yīng)用的效率。