每日經(jīng)濟(jì)新聞 2024-05-09 12:58:03
每經(jīng)記者 蔡鼎 每經(jīng)編輯 程鵬 蘭素英
一直以來(lái),從氨基酸序列出發(fā)預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu)是結(jié)構(gòu)生物信息學(xué)中最具挑戰(zhàn)的問(wèn)題。但幾年前,由Google DeepMind創(chuàng)建的基于深度學(xué)習(xí)的人工智能測(cè)序式AlphaFold解決了這個(gè)問(wèn)題,一時(shí)間成為頭條新聞。
北京時(shí)間5月8日(周三)晚間,科學(xué)頂刊《自然》雜志刊登了谷歌DeepMind AlphaFold團(tuán)隊(duì)和倫敦藥物研發(fā)公司Isomorphic Labs共同署名的論文,介紹了AlphaFold 3,這是AlphaFold的第三代版本,全新的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)系統(tǒng)能以前所未有的精度預(yù)測(cè)“蛋白質(zhì)數(shù)據(jù)庫(kù)(Protein Data Bank)”內(nèi)幾乎所有分子類型的復(fù)合物結(jié)構(gòu)。
論文稱,AlphaFold 3是一款革命性的系統(tǒng)。對(duì)于蛋白質(zhì)與其他分子類型的相互作用,AlphaFold 3在基準(zhǔn)測(cè)試中的準(zhǔn)確率比現(xiàn)有最好的傳統(tǒng)方法高出50%,且無(wú)需輸入任何結(jié)構(gòu)信息,這使得AlphaFold 3成為首個(gè)在生物分子結(jié)構(gòu)預(yù)測(cè)方面超越基于物理工具的方法的人工智能系統(tǒng)。
實(shí)際上,自初代AlphaFold問(wèn)世以來(lái),結(jié)構(gòu)生物學(xué)家們對(duì)其能力邊界的討論就從未停止。此前有研究證實(shí)AlphaFold還無(wú)法預(yù)測(cè)新的突變對(duì)蛋白質(zhì)的影響。不過(guò),這仍無(wú)法掩蓋AlphaFold在預(yù)測(cè)生物結(jié)構(gòu)方面前所未有的強(qiáng)大能力。美國(guó)洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室研究員、新墨西哥州聯(lián)盟高級(jí)科學(xué)家Thomas C. Terwilliger在去年11月發(fā)表于《自然》雜志上的論文中稱,“盡管AlphaFold預(yù)測(cè)并非全部準(zhǔn)確,但其提供了可信的假說(shuō),可以用作提示機(jī)制。所有這些能力很可能只是人工智能方法在結(jié)構(gòu)生物學(xué)中日益廣泛應(yīng)用的開端?!?/span>
AlphaFold 3的生物分子結(jié)構(gòu)準(zhǔn)確率
比現(xiàn)有最好的方法高50%?
論文稱,基于AlphaFold 2能力的提升,AlphaFold 3如今能預(yù)測(cè)蛋白質(zhì)與其他蛋白質(zhì)、核酸、小分子、離子、修飾蛋白質(zhì)殘基的復(fù)合物,以及抗體-抗原相互作用,其預(yù)測(cè)準(zhǔn)確性顯著超過(guò)當(dāng)前預(yù)測(cè)工具,包括AlphaFold-Multimer。DeepMind團(tuán)隊(duì)稱,這意味著AlphaFold 3將人類帶到了蛋白質(zhì)之外的更廣泛的生物分子領(lǐng)域。這一飛躍可能開啟更多變革性的科學(xué),從開發(fā)生物可再生材料和更具彈性的材料,到加速藥物設(shè)計(jì)和基因組學(xué)研究等。
圖片來(lái)源:《自然》
AlphaFold 2于2020年問(wèn)世,可根據(jù)蛋白質(zhì)的氨基酸(蛋白質(zhì)的基本成分)序列預(yù)測(cè)其3D結(jié)構(gòu)。論文第一作者、DeepMind 高級(jí)研究科學(xué)家John Jumper和同事稱,到目前為止,全球數(shù)以百萬(wàn)計(jì)的研究人員已經(jīng)使用AlphaFold 2在瘧疾疫苗、癌癥治療和酶設(shè)計(jì)等領(lǐng)域取得了發(fā)現(xiàn)。同時(shí),AlphaFold 2據(jù)稱已被用于預(yù)測(cè)數(shù)以億計(jì)的結(jié)構(gòu),而按照目前全球的結(jié)構(gòu)生物學(xué)實(shí)驗(yàn)的速度,這需要花費(fèi)數(shù)億年的研究時(shí)間。
據(jù)悉,AlphaFold 3的核心是深度學(xué)習(xí)模塊Evoformer的改進(jìn)版,Evoformer是AlphaFold 2的基礎(chǔ)架構(gòu)。論文稱,只要給定分子輸入列表,AlphaFold 3會(huì)使用一個(gè)類似于人工智能圖像生成器的融合網(wǎng)絡(luò)來(lái)組合預(yù)測(cè)結(jié)果,不僅能生成它們的聯(lián)合三維結(jié)構(gòu),還能揭示分子是如何結(jié)合在一起的。
圖片來(lái)源:《自然》
論文稱,AlphaFold 3在預(yù)測(cè)類似藥物的相互作用(包括蛋白質(zhì)與配體的結(jié)合以及抗體與目標(biāo)蛋白質(zhì)的結(jié)合)方面達(dá)到了前所未有的準(zhǔn)確性。在基準(zhǔn)測(cè)試中,AlphaFold 3的準(zhǔn)確率比現(xiàn)有最好的傳統(tǒng)方法高出50%,且無(wú)需輸入任何結(jié)構(gòu)信息,這使得AlphaFold 3成為首個(gè)在生物分子結(jié)構(gòu)預(yù)測(cè)方面超越基于物理工具的方法的人工智能系統(tǒng)。
DeepMind團(tuán)隊(duì)認(rèn)為,AlphaFold 3有能力將生物界帶到前所未有的高度。該系統(tǒng)能夠使科學(xué)家看到細(xì)胞系統(tǒng)的所有復(fù)雜性,包括結(jié)構(gòu)、相互作用和修飾,同時(shí)揭示了它們是如何相互聯(lián)系的,并有助于理解這些聯(lián)系是如何影響生物功能的——比如藥物的作用、激素的產(chǎn)生和DNA修復(fù)的健康保護(hù)過(guò)程。
圖片來(lái)源:《自然》
AlphaFold 3的表現(xiàn)表明,開發(fā)正確的深度學(xué)習(xí)框架可以大量減少在這些任務(wù)中獲得生物學(xué)相關(guān)性能所需的數(shù)據(jù)量,并擴(kuò)大已經(jīng)收集的數(shù)據(jù)的影響。DeepMind預(yù)計(jì)結(jié)構(gòu)建模將繼續(xù)改進(jìn),這不僅是因?yàn)樯疃葘W(xué)習(xí)的進(jìn)步,而且還因?yàn)閷?shí)驗(yàn)結(jié)構(gòu)確定方法的持續(xù)進(jìn)步,例如低溫電子顯微鏡和斷層掃描的巨大改進(jìn),將提供豐富的新訓(xùn)練數(shù)據(jù),以進(jìn)一步提高此類模型的泛化能力。實(shí)驗(yàn)和計(jì)算方法的并行發(fā)展有望推動(dòng)我們更快速地進(jìn)入一個(gè)對(duì)分子結(jié)構(gòu)和疾病治療更加了解的時(shí)代。?
論文同時(shí)介紹,谷歌DeepMind新推出的AlphaFold服務(wù)器是全球預(yù)測(cè)蛋白質(zhì)如何與細(xì)胞內(nèi)其他分子相互作用的最準(zhǔn)確的工具。
AlphaFold服務(wù)器是一個(gè)免費(fèi)的平臺(tái),生物學(xué)家可以利用AlphaFold 3的強(qiáng)大功能來(lái)模擬由蛋白質(zhì)、DNA、RNA以及一系列配體、離子和化學(xué)修飾物組成的結(jié)構(gòu)?!癆lphaFold服務(wù)器的影響將通過(guò)它們?nèi)绾问箍茖W(xué)家加速發(fā)現(xiàn)生物學(xué)和新研究領(lǐng)域的開放性問(wèn)題來(lái)實(shí)現(xiàn)。我們剛剛開始挖掘AlphaFold 3的潛力,迫不及待地想看看未來(lái)會(huì)發(fā)生什么。”DeepMind團(tuán)隊(duì)在論文中寫道。
而且,AlphaFold服務(wù)器可以幫助科學(xué)家提出新的假設(shè),并在實(shí)驗(yàn)室中進(jìn)行測(cè)試,從而加快工作進(jìn)度,實(shí)現(xiàn)進(jìn)一步的創(chuàng)新。如果采用傳統(tǒng)方法,要實(shí)現(xiàn)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè),不僅需要博士級(jí)別的知識(shí)水平,還花費(fèi)數(shù)十萬(wàn)美元才能完成。谷歌云平臺(tái)plaorm還為研究人員提供了生成預(yù)測(cè)的便捷方法,即使研究人員沒(méi)有計(jì)算資源或不掌握機(jī)器學(xué)習(xí)方面的專業(yè)知識(shí)也能操作。據(jù)悉,Isomorphic Labs正將AlphaFold 3與一套互補(bǔ)的內(nèi)部人工智能模型相結(jié)合,為內(nèi)部項(xiàng)目以及制藥合作伙伴進(jìn)行藥物設(shè)計(jì),以期加快并提高藥物設(shè)計(jì)的成功率。
AlphaFold預(yù)測(cè)并非完全準(zhǔn)確 但可作為提示機(jī)制AlphaFold在不斷迭代中展現(xiàn)出了強(qiáng)大的性能,而科學(xué)界對(duì)這一預(yù)測(cè)系統(tǒng)的邊界探討也一直存在。
美國(guó)洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室研究員、新墨西哥州聯(lián)盟高級(jí)科學(xué)家Thomas C. Terwilliger在去年11月發(fā)表于《自然》雜志上的論文中稱,AlphaFold的預(yù)測(cè)是有價(jià)值的假設(shè),雖然可以加速藥物的發(fā)現(xiàn),但并不能取代實(shí)驗(yàn)結(jié)構(gòu)確定工作。Terwilliger團(tuán)隊(duì)的研究顯示,雖然AlphaFold的預(yù)測(cè)通常是驚人的準(zhǔn)確,但他們發(fā)現(xiàn)AlphaFold預(yù)測(cè)的許多部分與相應(yīng)晶體結(jié)構(gòu)的實(shí)驗(yàn)數(shù)據(jù)不兼容。
圖片來(lái)源:《自然》
另外,一些研究人員也曾嘗試將AlphaFold應(yīng)用于會(huì)破壞蛋白天然結(jié)構(gòu)的各類突變,包括與早期乳腺癌有關(guān)的一個(gè)突變,但結(jié)果發(fā)現(xiàn),AlphaFold還無(wú)法預(yù)測(cè)新的突變對(duì)蛋白質(zhì)的影響,因?yàn)闆](méi)有演化上相關(guān)的序列可以用來(lái)研究。
不過(guò)需要指出的是,Terwilliger團(tuán)隊(duì)在上述論文中仍對(duì)AlphaFold的能力進(jìn)行了非常正面的評(píng)價(jià)。該團(tuán)隊(duì)寫道,“盡管存在局限性,但AlphaFold預(yù)測(cè)已經(jīng)在改變蛋白質(zhì)結(jié)構(gòu)假設(shè)的產(chǎn)生和檢驗(yàn)方式。盡管AlphaFold預(yù)測(cè)并非完全準(zhǔn)確,但它們提供了可信的假說(shuō),可以作為提示機(jī)制,并允許設(shè)計(jì)具有特定預(yù)期結(jié)果的實(shí)驗(yàn)?!?/span>
“所有這些能力很可能只是人工智能方法在結(jié)構(gòu)生物學(xué)中日益廣泛應(yīng)用的開端。人工智能方法必將從蛋白質(zhì)擴(kuò)展到核酸、配體、共價(jià)修飾、環(huán)境條件,以及所有這些實(shí)體之間的相互作用以及多種結(jié)構(gòu)狀態(tài)。隨著更多因素的加入以及序列和結(jié)構(gòu)信息數(shù)據(jù)庫(kù)的擴(kuò)大,這些預(yù)測(cè)的準(zhǔn)確性以及與之相關(guān)的不確定性很可能會(huì)不斷提高。預(yù)測(cè)結(jié)果將成為越來(lái)越有用的結(jié)構(gòu)假說(shuō),為生物系統(tǒng)的實(shí)驗(yàn)和理論分析奠定堅(jiān)實(shí)的基礎(chǔ)?!盩erwilliger補(bǔ)充道。
記者|蔡鼎
編輯|程鵬?蘭素英?杜恒峰
校對(duì)|王月龍
|每日經(jīng)濟(jì)新聞 ?nbdnews??原創(chuàng)文章|
未經(jīng)許可禁止轉(zhuǎn)載、摘編、復(fù)制及鏡像等使用
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP