棉花產(chǎn)量與纖維品質(zhì)如何受到DNA甲基化調(diào)控?在AI的幫助下,中國棉花育種專家成功破譯這一“密碼本”,并從中找出有望改良棉花品種的關(guān)鍵基因位點(diǎn)。
近日,由浙江大學(xué)棉花精準(zhǔn)育種團(tuán)隊(duì)、中國農(nóng)科院生物技術(shù)所和湖畔實(shí)驗(yàn)室(阿里巴巴達(dá)摩院)智慧育種團(tuán)隊(duì)組成的聯(lián)合科研團(tuán)隊(duì),綜合運(yùn)用遺傳學(xué)、生物大數(shù)據(jù)和AI技術(shù),構(gòu)建了涵蓋207個(gè)品種的棉花全基因組DNA甲基化圖譜,鑒定2.87億個(gè)單甲基化多態(tài)性(SMP)位點(diǎn),規(guī)模為目前所有作物之最。聯(lián)合團(tuán)隊(duì)從中發(fā)現(xiàn)43個(gè)潛在參與纖維發(fā)育的eQTM基因,為棉花育種提供重要的候選基因列表。相關(guān)論文發(fā)表在國際頂級期刊《細(xì)胞研究》(Cell Research)上。
棉花是全球最大的天然紡織纖維來源,需要通過不斷聚合優(yōu)異的基因組遺傳位點(diǎn),進(jìn)行品種改良。在AI、大數(shù)據(jù)等技術(shù)加持下,農(nóng)業(yè)正在步入“智慧育種”時(shí)代,通過綜合作物基因型數(shù)據(jù)、表型數(shù)據(jù)和環(huán)境數(shù)據(jù),預(yù)測作物性狀,精準(zhǔn)篩選出優(yōu)異基因。
此次,聯(lián)合科研團(tuán)隊(duì)聚焦DNA甲基化對作物的影響。DNA甲基化可以在不改變棉花DNA序列的情況下,影響棉花產(chǎn)量、纖維品質(zhì)等農(nóng)藝性狀,并通過自然進(jìn)化和人工選擇傳遞。團(tuán)隊(duì)收集了207個(gè)品種的棉花全基因組甲基化測序數(shù)據(jù)、基因組測序數(shù)據(jù)、轉(zhuǎn)錄組測序數(shù)據(jù),再結(jié)合農(nóng)藝性狀的表型數(shù)據(jù),進(jìn)行關(guān)聯(lián)分析,首次構(gòu)建起群體尺度的棉花全基因組DNA甲基化圖譜,涵蓋2.87億個(gè)單甲基化多態(tài)性(SMP)位點(diǎn)。其中,僅甲基化測序數(shù)據(jù)就達(dá)到17TB。
湖畔實(shí)驗(yàn)室融合AI、并行計(jì)算等技術(shù)開發(fā)了一套新型算法,加速海量遺傳數(shù)據(jù)的分析處理。湖畔實(shí)驗(yàn)室智慧育種團(tuán)隊(duì)負(fù)責(zé)人顧斐表示:“相比起傳統(tǒng)方法,AI加成的分析計(jì)算速度提升近100倍,有助于開展億級序列對比、群體變異分析和多組學(xué)關(guān)聯(lián)分析,在數(shù)百個(gè)遺傳變異、數(shù)萬個(gè)基因以及數(shù)億個(gè)甲基化位點(diǎn)之間建立起復(fù)雜的映射關(guān)系。”
聯(lián)合科研團(tuán)隊(duì)進(jìn)而首次繪制出與棉花纖維發(fā)育相關(guān)、獨(dú)立于遺傳因素的表觀調(diào)控網(wǎng)絡(luò),揭示了43個(gè)潛在參與纖維發(fā)育的eQTM基因。其中一個(gè)位點(diǎn)已通過基因編輯實(shí)驗(yàn),證實(shí)其調(diào)控棉花纖維長度的作用。此外,研究人員研發(fā)了深度學(xué)習(xí)模型DeepFDML,基于DNA甲基化位點(diǎn)附近的序列,預(yù)測影響基因表達(dá)的甲基化位點(diǎn),未來有望發(fā)現(xiàn)更多具有育種價(jià)值的信息。
圖說:群體單堿基DNA甲基化多態(tài)性的精準(zhǔn)鑒定、調(diào)控網(wǎng)絡(luò)解析與預(yù)測模型構(gòu)建
浙江大學(xué)棉花精準(zhǔn)育種團(tuán)隊(duì)方磊教授表示:“這項(xiàng)研究成果證明了DNA甲基化數(shù)據(jù)可作為育種資源,為棉花品種改良提供新的思路。依托生命科學(xué)+AI,育種家們將持續(xù)挖掘關(guān)鍵基因、預(yù)測農(nóng)藝性狀,加速培育‘超級’作物。”
據(jù)悉,湖畔實(shí)驗(yàn)室(數(shù)據(jù)科學(xué)與應(yīng)用浙江省實(shí)驗(yàn)室)成立于2020年7月,依托阿里巴巴達(dá)摩院建設(shè),聚焦數(shù)據(jù)科學(xué)領(lǐng)域的“數(shù)據(jù)智能”和“新型計(jì)算”兩大方向。在智慧育種領(lǐng)域,湖畔實(shí)驗(yàn)室牽頭研發(fā)全流程智慧育種平臺,為育種家們提供包含育種數(shù)據(jù)管理和分析、計(jì)算加速、AI預(yù)測的“中央廚房”,大幅縮短培育新品種的周期。