分子結(jié)構(gòu)預(yù)測是生物信息學(xué)的“圣杯”,2024年諾貝爾化學(xué)獎授予了AI蛋白質(zhì)結(jié)構(gòu)預(yù)測系統(tǒng)AlphaFold的兩位開發(fā)者,標(biāo)志著人工智能(AI)預(yù)測方法能給生命科學(xué)研究帶來革命性推進(jìn)。然而,AlphaFold仍然未解決核酸結(jié)構(gòu)預(yù)測的問題,RNA三維結(jié)構(gòu)預(yù)測領(lǐng)域仍亟需明確其瓶頸和發(fā)展方向。
RNA-Puzzles是一個2012年開始的國際合作項目,致力于評估RNA三維結(jié)構(gòu)預(yù)測的最新進(jìn)展。組織者在RNA三維結(jié)構(gòu)數(shù)據(jù)發(fā)表之前將需要預(yù)測的序列發(fā)給全球的結(jié)構(gòu)預(yù)測團(tuán)隊,在預(yù)測結(jié)束后各個團(tuán)隊反饋預(yù)測結(jié)果,等三維結(jié)構(gòu)數(shù)據(jù)發(fā)表以后將預(yù)測結(jié)構(gòu)與實驗測定的結(jié)構(gòu)進(jìn)行比較。從而評估RNA三維結(jié)構(gòu)預(yù)測的準(zhǔn)確性。
2024年12月2日,廣州國家實驗室、廣醫(yī)-廣州生物院聯(lián)合生科院苗智超教授團(tuán)隊聯(lián)合中國科學(xué)院溫州醫(yī)學(xué)研究所 Eric Westhof 院士,在 Nature Methods 期刊發(fā)表了題為:RNA-Puzzles Round V:Blind predictions of 23 RNA structures 的論文,公布了RNA-Puzzles Round V 的結(jié)果,對來自全球18個團(tuán)隊的預(yù)測進(jìn)行了大規(guī)模評估,涉及23個RNA結(jié)構(gòu),包括RNA元件、適配體、病毒元件、核酶和核開關(guān)等多種RNA類型。
本輪比賽(Round V)的預(yù)測結(jié)果顯示,在RNA結(jié)構(gòu)建模方面,一些關(guān)鍵步驟仍需克服。特別是,堿基配對的識別:準(zhǔn)確識別形成RNA螺旋的堿基對仍然是一個挑戰(zhàn);non-Watson-Crick結(jié)構(gòu)模塊的識別:正確識別non-Watson-Crick堿基對和RNA結(jié)構(gòu)模塊對于精確建模至關(guān)重要;螺旋間的同軸堆積(coaxial):避免螺旋間的打結(jié),并實現(xiàn)正確的同軸堆積是提高預(yù)測準(zhǔn)確性的關(guān)鍵。論文還討論了RNA結(jié)構(gòu)預(yù)測的難度取決于是否存在同源模板或者預(yù)測序列的長度,鏈數(shù)等因素。
為了對預(yù)測結(jié)果進(jìn)行客觀評估,本輪比賽采用了多種評估指標(biāo),包括:均方根偏差(RMSD):用于衡量預(yù)測結(jié)構(gòu)與實驗結(jié)構(gòu)之間的整體相似性,較低的RMSD值表示預(yù)測精度較高;相互作用網(wǎng)絡(luò)保真度(INF):評估預(yù)測結(jié)構(gòu)中堿基配對和堿基堆積相互作用的準(zhǔn)確性;變形指數(shù)(DI):綜合考慮RMSD和INF值,更全面地反映預(yù)測結(jié)構(gòu)的質(zhì)量;IDDT分?jǐn)?shù)和ARES分?jǐn)?shù):分別側(cè)重于局部和全局精度,以及RNA樣結(jié)構(gòu)特性的評估。這些算法工具和測評數(shù)據(jù)都已經(jīng)開源,發(fā)布在RNA-Puzzles官網(wǎng)(www.rnapuzzles.org)。
本輪比賽中,排名前四的團(tuán)隊中有三個團(tuán)隊也曾在CASP15蛋白質(zhì)結(jié)構(gòu)預(yù)測比賽的RNA賽道中名列前茅,這表明前幾名的預(yù)測方法具有較好的穩(wěn)定性。尤其是陳世杰教授和Rhiju Das團(tuán)隊,陳世杰教授也在CASP16的比賽中獲得全球第一,但不同預(yù)測方法在具體表現(xiàn)上差異不大。未來RNA結(jié)構(gòu)預(yù)測領(lǐng)域有望借助人工智能結(jié)合經(jīng)典物理模擬方法和專家經(jīng)驗實現(xiàn)進(jìn)一步突破。
論文詳細(xì)分析了不同功能類型RNA的預(yù)測結(jié)果,具體有——
RNA元件:對一些簡單的RNA元件,預(yù)測結(jié)果較為理想;
適配體:對與配體結(jié)合的適配體,預(yù)測精度相對較低,尤其是在識別配體結(jié)合位點方面;
病毒元件:一些病毒RNA元件的預(yù)測結(jié)果較好,但也存在一些預(yù)測精度較低的情況,尤其是一些包含假結(jié)的結(jié)構(gòu);
核酶:對核酶的催化位點殘基的預(yù)測,準(zhǔn)確性與RMSD值密切相關(guān);
核開關(guān):對一些具有同源結(jié)構(gòu)的核開關(guān),預(yù)測結(jié)果較好;而對于一些復(fù)雜的核開關(guān),例如T-box核開關(guān),預(yù)測精度仍然有待提高。
歡迎全球?qū)NA結(jié)構(gòu)模擬和結(jié)構(gòu)解析有興趣的同仁加入我們,歡迎參與RNA-Puzzles結(jié)構(gòu)預(yù)測,也歡迎結(jié)構(gòu)生物學(xué)家把解析的結(jié)構(gòu)提供給RNA-Puzzles進(jìn)行預(yù)測!
廣醫(yī)-廣州生物院聯(lián)合生科院為論文第一單位,廣州實驗室博士生卜凡是論文第一作者,法國科學(xué)院院士Eric Westhof和廣州國家實驗室研究員、廣醫(yī)-廣州生物院聯(lián)合生科院苗智超教授為共同通訊作者。
苗智超教授和Eric Westhof院士長期專注于生物大分子結(jié)構(gòu)模擬和設(shè)計,十多年來一直擔(dān)任全球RNA三維結(jié)構(gòu)預(yù)測比賽的負(fù)責(zé)人,制定了該領(lǐng)域的評價標(biāo)準(zhǔn)。苗智超課題組近年來的通訊作者工作在 Nature Medicine、Nature Methods、Nature Neurosciences、Nature Communications、Nucleic Acids Research 等學(xué)術(shù)期刊上發(fā)表。團(tuán)隊非常歡迎有單細(xì)胞組學(xué)、空間轉(zhuǎn)錄組學(xué)、生物信息和人工智能等科研背景的博士和碩士研究生、博士后、副研究員的加入。