基因測序是精準醫(yī)療的基礎,具廣闊應用和增長空間
隨著人類基因組測序技術的飛速提升、生物醫(yī)學分析技術的快速發(fā)展和大數據分析工具的日益完善,我們正進入全新的醫(yī)療健康時代——精準醫(yī)療。
精準醫(yī)療是一種基于“個人”的定制醫(yī)療模式,其以個體的組學信息和遺傳信息為基礎,以環(huán)境、生活方式、既往病史及診療方式等為跟蹤對象,搜集全方位、可量化、有前瞻性和時效性的個體數據,通過數據的綜合分析、挖掘形成有價值的醫(yī)學信息,最終設計出針對個體的最優(yōu)解決方案?;驕y序為個體提供連續(xù)基因大數據,是精準醫(yī)療的基礎和重要實現途徑,制藥、器械、IT 等行業(yè)巨頭紛紛布局該領域。
基因測序技術憑借靈敏度高、精度和通量高、價格低廉等優(yōu)勢,成為基因檢測技術中獲取人體基因組數據的主流技術,通過將基因組數據與無線生物傳感器獲取的生命體征信息(如血壓、心跳、腦電波、體溫等),成像設備中的個體信息(如 CT、MRI、超聲等)以及傳統(tǒng)醫(yī)學數據相結合,精準醫(yī)療為個體提供全新的定制醫(yī)療。
(一)“一刀切”治療時代已過時,啟動精準醫(yī)療刻不容緩
傳統(tǒng)醫(yī)學痛點催生精準醫(yī)療需求。傳統(tǒng)的循證醫(yī)學是結合臨床醫(yī)生的個人實踐經驗和客觀的科學研究證據,對于癥狀相同的病人使用相同劑量的同種藥物進行治療,但治療效果卻千差萬別。傳統(tǒng)治療方案顯示,腫瘤的無效率高達 75%,糖尿病無效率 43%,抑郁癥無效率也有 38%。人們逐漸意識到大多數疾病的發(fā)生是自身遺傳密碼和外界環(huán)境共同作用的結果。
精準醫(yī)療借助可監(jiān)測的遺傳信息和環(huán)境信息,針對個體提供定制的優(yōu)化治療方案,提升現有治療水平,并盡量在發(fā)病前就有望有效預防。
精準醫(yī)療具定量化、個體化、事前預防和連續(xù)性四大特點,是對傳統(tǒng)醫(yī)學的重要革新,進一步解決了傳統(tǒng)醫(yī)學的痛點,避免醫(yī)生由于“只見森林不見樹木”導致的過度依賴主觀經驗、描述和循證醫(yī)學的大眾數據,造成對個體的診療有效率低、副作用大、事后舉措倉促等問題。精準醫(yī)療在提升醫(yī)療效率的同時,還可降低不合理醫(yī)療造成的高昂費用,具有廣泛的社會效益。
(二)基因測序是精準醫(yī)療的基礎
1、基因測序是建立“組學”大數據庫和分析的基礎,推動精準醫(yī)療實現“同病異治”和“異病同治”
精準醫(yī)療旨在向患者提供疾病精確診斷和個性化的治療方案,并將醫(yī)療技術提升到病前預防水平。
相關技術的發(fā)展有兩個要素:
1)構建“組學”大數據樣本庫,如基因組學、轉錄組學、蛋白組學等;
2)探究基因型與樣本表型的關聯(lián),通過生物信息學分析和遺傳診斷,建立遺傳信息與臨床檢驗和影像學等數據的關聯(lián)關系,實現精確的疾病分類和診斷,制定個性化的疾病預防和治療方案,做到“同病異治”和“異病同治”。
上述兩要素都與基因測序密不可分。
2、個體間基因組0.5%的差異可被基因測序捕捉
人體基因組由 30 億對堿基組成,不同人之間基因組的差別只有千分之五。 正是這不到 1%的差別與外部環(huán)境共同決定著人體表型,如高矮胖瘦、酒量、乳糖耐受以及疾病等?;驕y序是通過采集血液、體液或細胞,使用測序儀器獲取被檢測者的 DNA 序列,然后利用生物信息學方法將該基因信息與已知的基因突變數據庫進行比對,并分析其中的異常突變信息,進而診斷疾病,甚至用于患病風險的預測。
人體基因組測序內容主要包括靶向重測序、外顯子測序、轉錄組測序和全基因組測序。
通過與正常序列的比對,發(fā)現異常突變。異常突變信息按發(fā)生突變的堿基數量分為 3 類:
(1)單個堿基的突變:單核苷酸多態(tài)性(SNP),
(2)20bp 以下堿基的變異:插入-缺失(Indel),
(3)20bp 以上堿基變異:插入(Insertion)、刪除(Deletion)、拷貝數變異(CNV)以及基因組結構變異(SV)等。
3、基因測序是基因檢測的基礎和主流技術
基因檢測技術,應用分子生物學的方法檢測患者體內遺傳物質的結構或表達水平的變化,以實現精準診斷,從而指導更優(yōu)的治療方案。目前基因檢測常見手段包括聚合酶鏈式反應
(PCR)、熒光原位雜交技術(FISH)、基因芯片技術(Gene Chip)、轉錄介導的擴增(TMA)和基因測序技術等,其中基因測序是其他四種檢測方法的基礎和主流技術。
(三)供需兩端共同驅使基因測序飛速發(fā)展
1、測序成本和測序耗時成指數級下降
測序的成本和耗時呈指數級下降。 隨著二代測序技術 (Next Generation Sequencing, NGS)的不斷革新,測定一個人全基因組數據的成本,由原來的上億美金,快速下降到目前 1000 美元,測序時間也降至 3 天。
2、人類基因組大數據累積初級階段完成
經過 10 多年的累積,人體基因組數據庫已經初步形成規(guī)模。 2003 年,由美中等 6 國科學家歷時 13 年、耗資 30 億美金的“人類基因組計劃” (Human Genome Project) 宣布完成。同年,“DNA 元件百科全書計劃”啟動,并于 2012 年公開發(fā)表研究成果,對人類疾病相關的基因序列研究有重大影響。隨后,“國際千人基因組計劃”、英國“十萬基因組計劃”、美國“百萬基因組計劃”先后于 2008 年、 2014 年和 2015 年啟動,為人類基因組樣本的累積和探究疾病與基因的關系提供了扎實的基礎。
3、基因組數據分析方法應運而生
人體基因組的分析已初步流程化和標準化。 生物信息學自 1987 年首次提出后,經過近 30年的發(fā)展,從最初的基因組數據的收集和存儲,到利用數學建模和人工智能思想,挖掘數據背后的生物學意義、對樣本數據進行合理分類、建立合理的二級和三級數據庫,再到利用比較基因組學的方法,通過短讀序列拼接、基因預測和功能注釋,已有一定的能力用于處理龐大復雜的基因組數據。
4、疾病預防和個性化治療需求遠未滿足
現代科學證實,大部分疾病是基因與外部環(huán)境共同作用的結果,幾乎所有疾病(除外傷)的發(fā)生均與基因有關。 人類基因組研究成果表明絕大部分人群攜帶有某些類疾病的易感基因,當人群接觸某些不良因子和環(huán)境時,其發(fā)病幾率遠高于非攜帶易感基因人群。因此,人們逐漸意識到只有真正了解自身的基因情況,才能通過改善客觀環(huán)境、定期體檢等方式盡可能地延緩或阻止疾病的發(fā)生。
我國慢性病患者人數快速增長,對精準醫(yī)療有著迫切需求。推動精準醫(yī)療需求。目前我國每年 310 萬癌癥新增案例,高血壓患者達 2.6 億,糖尿病患者超過 1 億人,糖尿病潛在人群1.5 億;每年 220 萬癌癥死亡案例和 300 萬心血管疾病死亡案例。上述疾病通過傳統(tǒng)方法難以根治或治愈,對精準醫(yī)療有著迫切需求。
越來越多的人意識到基因測序對自身健康的重要性。2011 年去世的蘋果公司創(chuàng)始人史蒂芬?喬布斯患癌時,曾接受過全基因組測序。2013 年 5 月,奧斯卡影后安吉麗娜?朱莉通過基因檢測和相應的切除手術,將患乳腺癌風險從 87%降到 5%。
5、基因測序市場每年有望保持 20%以上增速
精準醫(yī)療市場增速將遠超醫(yī)藥行業(yè)整體水平。 據BCC Research 預測, 2015 年全球精準醫(yī)療市場規(guī)模近 600 億美元,今后 5 年年增速預計為 15%,是醫(yī)藥行業(yè)整體增速的 3 至 4 倍。
其中,全球基因測序市場規(guī)模從 2007 年的 800 萬美元增長至 2013 年約 45 億美元,預計未來幾年將保持超過 20%的增速,至 2018 年將達到約 117 億美元。Markets and markets 預測中國的基因測序產業(yè) 2012-2017 年間 CAGR 有望達 20%-25%。
二、基因測序全產業(yè)鏈:上游測序儀器制造、中游測序服務與下游數據分析共同構成
基因測序全產業(yè)鏈劃分為上游的測序儀器與試劑耗材市場,中游的基因測序服務市場和下游的生物信息學分析市場。中下游市場面向群體包括醫(yī)院、藥廠、科研機構以及消費者等,可分為醫(yī)療和非醫(yī)療兩個領域。
醫(yī)療領域可分為人體基因組和人體微生物基因組兩個子領域。針對人體基因組的主要產品有腫瘤學(診斷篩查與治療、靶向用藥、伴隨診斷等)、生育(無創(chuàng)產前診斷、胚胎植入前檢測、新生兒遺傳病排查、親子鑒定等)、遺傳學疾病和新藥研發(fā)指導等。目前人體微生物基因組與宿主健康的關系也已被重視,如 2007 年和 2008 年,美國國立衛(wèi)生研究院(NIH)和歐盟先后啟動了人體微生物組計劃(HMP)和人體腸道宏基因組計劃(MetaHIT),可通過分析人體微生物基因組檢測宿主的腸道疾病、神經系統(tǒng)疾病、肝病、糖尿病、肥胖以及腹腔腫瘤等。
在非醫(yī)療領域中,可以通過環(huán)境微生物基因組研究治理環(huán)境污染的新方法、探測石油存儲和地質學研究,也可以用于農牧業(yè)配種和司法鑒定等。本篇報告主要討論基因測序在醫(yī)療領域中針對人體基因組的應用。
(一)歐美公司壟斷測序儀器與耗材市場
1、二代測序是目前主流測序技術,Illumina 占最大市場份額
測序技術是測序儀器的核心所在,迄今為止已歷經四代發(fā)展。其中主要的是前三代測序技術: 第一代測序技術,即 Sanger 測序技術;第二代測序技術是當今主流技術,主要有 Illumina公司的 Solexa 和 HiSeq 技術, Life Tech 公司的 Solid 技術和 Roche 的 454 技術;第三代 Pacific Biosciences 公司的 SMRT 測序技術。第四代測序技術正向著測序儀器體積更小的方向發(fā)展,如 Oxford Nanopore Technologies 公司的 MinIon 納米孔單分子測序技術。
主要公司有 Illumina, Life Tech (被 Thermo Scientific 以 136 億美元收購)和 Roche。其中 Illumina憑借其超高通量和相對較長讀長的優(yōu)勢,占有超過 70%的市場份額。
2、三四代測序技術 10 年內憑借超長序列讀長取代二代測序技術
我們預計 10 年后二代測序技術會被三、四代測序技術所取代。各代測序均有不足之處,一代測序的主要缺陷是低通量和高成本,二代的缺陷是序列長度較短,三四代測序在準確率方面有嚴重缺陷。由于 NGS 技術面臨的短序列缺陷可以通過生物信息學工具在一定程度上進行彌補,因此二代測序技術是現今最穩(wěn)定,應用范圍最廣泛的測序技術。但目前科學家正在通過減緩 DNA 序列通過納米孔速度的方式提高第三代測序的準確度,相關成果已發(fā)表在《Nature》子刊。我們預計 10 年內三、四代測序的準確度將會顯著提升,屆時將在保證測序通量的基礎上,憑借著超長序列讀長的優(yōu)勢取代二代測序。
基因測序全產業(yè)鏈劃分為上游的測序儀器與試劑耗材市場,中游的基因測序服務市場和下游的生物信息學分析市場。中下游市場面向群體包括醫(yī)院、藥廠、科研機構以及消費者等,可分為醫(yī)療和非醫(yī)療兩個領域。
(二)基因測序服務市場百家爭鳴,積極向上下游延伸
目前全球有上千家廠商提供測序服務,中國有超過 200 家。美國擁有全世界最多得測序儀,中國測序儀數量不超過 500 臺。隨著市場對測序的需求不斷提升,中游市場提供測序服務的對象包括醫(yī)院、疾控中心、科研機構等,提供包括用于無創(chuàng)產前診斷、腫瘤診斷與治療、遺傳學診斷以及輔助生殖等相關的基因測序服務。
我國測序服務提供商積極地向產業(yè)鏈上游延伸。國內在測序儀器市場的開發(fā)策略分為兩類:
(1)第一類是通過與國外儀器生產商合作,買斷產品在國內的全部權利。如貝瑞和康與Illumina 合作生產的新型測序儀、華大基因收購美國基因測序儀公司 Complete Genomics 后基于該平臺開發(fā) BGISEQ1000 測序儀、達安基因與 Life Tech 合作的 DA8600 測序儀。這種模式雖然使用國外的儀器技術,但通過國內的儀器設備通道申報 CFDA,申報和審批相對較快。
(2)第二類是自主研發(fā)模式,如紫鑫藥業(yè)與中科院基因組所合作的自主研發(fā)的二代測序儀器已于2014 年 4 月 18 日發(fā)布,數據產出量與 Roche 454 相當。
中下游市場結合非常緊密,測序服務公司往往會提供有償的生物信息學分析服務。美國大型的測序服務公司有:Sequenom, CardioDx 和 Foundation Medicine 等,國內的主流測序服務公司有華大基因、諾禾致源、貝瑞和康、達安基因以及北陸藥業(yè)等。不同公司根據提供服務的內容有所區(qū)分。
二代測序技術憑借通量大、精度高、價格相對低廉等優(yōu)勢,已成為目前主流測序技術。
由于專利保護力度大和技術門檻高,二代測序儀器制造市場壁壘較高,已被歐美公司壟斷。
(三)下游數據解讀能力需進一步發(fā)展
人體基因組共有 23 對染色體,包含超過 30 億個堿基,而目前僅有 3%能從臨床給予解釋。由測序服務公司提供的原始序列文件在經過系統(tǒng)地分析處理前,無法提供任何有效的信息。
數據有效分析的三要素包括高性能計算平臺、專業(yè)的分析軟件和高質量的大樣本數據庫。計算平臺用于對測序儀器得出的原始序列文件進行質量剔除、序列匹配等一系列分析的基礎工作,分析軟件和大樣本數據庫用于遺傳解讀和咨詢。據 Ebiotrade 調查,69%的被調查人員認為數據的分析解讀是影響測序產業(yè)鏈發(fā)展最大的瓶頸。
數據分析的有效性將決定下游市場公司的核心競爭力。目前全球有超過 100 家生物信息公司提供基因數據分析服務,成熟的高通量測序技術產生了海量數據,生物信息學分析市場涵蓋數據壓縮存儲、工作平臺、數據分析軟件等?,F階段生物信息學技術可以對基因組學數據進行初級分析,主要集中在分析人體基因組的 SNP 和 Indel 檢測,而分析 SV 和 CNV 則受限于樣本量較少和 NGS 測序技術的局限性,無法使用精確的數學模型將上述變異與樣本表型相關聯(lián)。
三、市場前景:上游市場增速放緩,中下游市場潛力巨大
基因測序服務市場增速快,預計 2016 年超過測序儀器市場。據 Markets&Markets 預測,2014-2020 年上游市場中測序儀的復合增長率是 15.4%。中游測序服務市場重資產、技術附加值低,將是產業(yè)鏈中增速最快的,據 BCC Research 預測 2011-2016 年復合增長率為 29%。下游生物信息學分析市場輕資產、技術附加值高,據 Frost&Sulivan 預測 2012-2018 年復合增長率為 22.7%。
(一)測序服務產品主推無創(chuàng)產前診斷、腫瘤診斷與個性化治療
目前中下游市場主要應用領域有無創(chuàng)產前診斷,腫瘤診斷與治療、遺傳病風險評估和輔助生殖等。其中無創(chuàng)產前診斷較為成熟,腫瘤診斷與治療預計很快將商業(yè)化,遺傳病風險評估市場仍需要培育。不同領域按照技術成熟度高低,分布在不同的生命周期中。
1、無創(chuàng)產前診斷:胎兒產前診斷技術的革命性創(chuàng)新,市場遠未飽和
2、腫瘤診斷與治療:預測患癌風險,制定個性化治療方案,監(jiān)控治療過程
3、輔助生殖:選擇健康胚胎,提高試管嬰兒成功率
4、遺傳病風險評估:提示患病風險,及早干預
(二)國內外中下游市場情況
1、美國:NIPT 市場已被全面覆蓋,腫瘤診斷與治療受到密切關注
2、中國:NIPT 市場接近飽和,企業(yè)紛紛涉足腫瘤診斷治療市場
(三)未來市場空間預測:腫瘤診斷與治療成為重頭戲
(四)四大因素限制下游應用,瓶頸有望逐步克服
1、基因組樣本量決定疾病預測模型準確性
2、NGS 序列難以被恢復成完整基因組
3、遺傳咨詢人才和 IT 人才匱乏
4、臨床醫(yī)師缺乏基因組學認知,難以臨床指導治療方案
5、測序瓶頸逐步克服,預計 2018 年后可明顯改善醫(yī)療健康服務
四、政府鼓勵發(fā)展基因測序,配套認證體系有待建立
(一)基因測序相關政策東風頻吹,臨床級產品受政府試點和監(jiān)管
(二)我國消費級測序產品的配套監(jiān)管和認證體系有待建立
五、國外公司商業(yè)模式:依托先天稟賦系統(tǒng)性布局
國外公司對于基因測序領域的部署具有戰(zhàn)略性和系統(tǒng)性,各個公司依托自身的先天稟賦,向上游或下游延伸,鞏固自身的行業(yè)壁壘。
23andMe 專注于降低價格收集人體基因組樣本用于后續(xù)與藥廠的合作;Illumina 在鞏固 NGS 測序霸主地位的同時進軍中下游市場;羅氏則著力于開發(fā)和收購三四代測序,同時開拓中下游市場;谷歌充分利用互聯(lián)網公司優(yōu)勢,通過發(fā)展云端存儲分析技術收集基因組樣本。
(一)23andMe:大量收集基因組數據,進軍藥物研發(fā)領域
(二)羅氏:布局三四代測序,制藥、診斷與器械協(xié)同發(fā)展,構筑精準醫(yī)療壁壘
(三)Illumina:站穩(wěn)測序腳跟,進軍基因測序醫(yī)療市場
(四)谷歌:涉足下游領域,試圖通過基因組樣本量分羹市場
六、我國基因測序產業(yè)處于初期布局階段
(一)國內公司:處于產業(yè)發(fā)展初期,積極布局基因測序領域
中國的基因測序產業(yè)尚處于起步階段,技術和政策層面尚未成熟。行業(yè)領頭羊為華大基因,來自華大的人支撐國內基因行業(yè)的發(fā)展。上市公司中,多家公司通過并購參與基因測序板塊的一部分業(yè)務,積極地在產業(yè)鏈的上中下游布局。并且除 NIPT 市場成熟度較高外,腫瘤診斷和個性化治療、胚胎植入前遺傳學篩查和診斷和遺傳病診斷還沒能形成成熟的市場,相關的診斷和治療不能成為醫(yī)療行業(yè)的標準,仍需較長時間的累積與發(fā)展。
(二)國內商業(yè)模式探討
1、測序儀器和試劑:力爭非核心測序耗材國產化
2、分析技術:現有數據分析方法壁壘較低,應積極搶奪基因組數據資源發(fā)展高級分析方法
3、基因測序產品:CFDA 審批是關鍵,銷售渠道很重要
(三)投資邏輯:短期內關注獲取基因組樣本和臨床表型數據能力強的公司,長期內關注發(fā)展三四代測序技術的公司
基因測序技術目前以Illumina 的二代測序(NGS)為主導,預計 10 年內三、四代測序技術將在保證測序準確率和通量的基礎下,憑借超長序列讀長等優(yōu)勢取代二代測序。短期關注獲取基因組樣本和臨床表型數據能力強的公司。精準解讀基因組信息需利用大量基因組數據作為學習集,訓練疾病預測模型的參數。
驅動因素、關鍵假設及主要預測:
1、 市場供應端和需求端驅使基因測序市場發(fā)展,市場增速超過 20%
測序成本和耗時的下降、人體基因組數據累積初級階段完成、標準化的生物信息學分析方法初步建立、個體對疾病預防和個性化治療的需求驅動基因測序市場飛速發(fā)展。全球基因測序市場規(guī)模從 2007 年的800萬美元增長至 2013 年約45億美元,據 BCC Research 預計未來幾年將保持超過 20%的增速,至 2018 年將達到約117億美元。
2、 二代測序已處于市場發(fā)展中后期,預計 10 年后被三四代測序取代
由于通量大、精度高、價格相對低廉等優(yōu)勢,二代測序技術成為目前主流測序技術。但其明顯缺陷是序列長度較短,難以完全還原人體基因組數據,為后續(xù)生物信息學分析和遺傳學解讀造成障礙。預計10年后,三、四代測序技術可以在保證精確度的情況下實現長序列(>10000bp)測序。
3、基因測序服務市場增速快,腫瘤診斷與治療受到密切關注
中游測序服務市場重資產、技術附加值低,據 BCC Research 預測將是產業(yè)鏈中增速最快的,預計 2011-2016 年復合增長率為 29%。同時腫瘤診斷與治療將會占據中下游市場約 60%的市場份額。我們預計 2018 年,二代測序技術在肺癌、腸癌和乳腺癌相關領域的滲透率將會達到或超過 50%,屆時我國每年腫瘤測序市場將達到近 150 億人民幣。
特別推薦:銀河證券與市場不同的觀點
銀河證券認為基因測序產品發(fā)展的長期瓶頸是測序技術水平。NGS 測序讀長過短,直接影響對基因組數據的解讀能力,包括生物信息學分析技術和遺傳咨詢。人體基因組包含超過 60 億個堿基,通過 NGS 測序得到的基因組,只能對其中單個堿基的突變(SNP)或 20bp 以下的堿基突變(Indel)進行分析,僅有 3%序列能從臨床給予解釋。然而分析基因組序列的結構變異和拷貝數變異將是攻克復雜疾病的突破口。
銀河證券認為基因測序產品發(fā)展的短期瓶頸是獲取高質量基因組數據和臨床表型數據的能力。目前公司對于基因組數據的遺傳解讀大部分通過文獻調研,但該方法對不同地區(qū)的不同人種并不適用。為通過基因組準確解讀患病情況,統(tǒng)計學方法和數學建模必不可少。高質量的基因組樣本作為自變量、臨床表型數據作為因變量,對模型參數的訓練有著舉足輕重的作用。
投資策略:短期內關注獲取基因組樣本和臨床表型數據能力強的公司,長期關注發(fā)展三四代測序技術的公司。
銀河證券對國外公司商業(yè)模式和投資策略進行梳理,發(fā)現主要有兩個布局方向:
(1)累積基因組樣本,如 23andMe 和 Google 均通過累積基因組樣本量分羹市場;
(2)發(fā)展超長讀長的新型測序技術:如羅氏則放棄二代測序市場,重點布局三四代測序和腫瘤領域。我們認為只有通過累積足夠數量的“專病”基因組樣本和發(fā)展三四代測序技術,才能將疾病的基因型與表型完美關聯(lián),最終實現對疾病的有效預防、精確診斷和個性化治療。
投資時應注意風險因素:短期內基因測序產品難以獲得飛躍式發(fā)展,大部分處于消費級和科研級應用階段。
備注:本文僅代表銀河證券觀點,不代表本網觀點。