2023-09-07 14:46:17
9月7日,2023騰訊全球數(shù)字生態(tài)大會于深圳成功舉辦。會上,騰訊集團(tuán)副總裁、政企業(yè)務(wù)總裁李強(qiáng)提到,針對傳染病和癌癥等疾病領(lǐng)域面臨的耐藥性問題,騰訊量子實(shí)驗(yàn)室構(gòu)建了一個海量的 MdrDB 耐藥性數(shù)據(jù)庫,樣本量達(dá)到 10 萬。
豐富的數(shù)據(jù)量,能夠?yàn)?AI 進(jìn)行藥物的耐藥性測試提供足夠的訓(xùn)練樣本,使用 MdrDB 的 AI 耐藥性預(yù)測精準(zhǔn)度提升 30%。目前,MdrDB 已向行業(yè)和學(xué)術(shù)機(jī)構(gòu)全面開放,已有來自 6 個大洲的 43 個國家和地區(qū)的 3000 多名用戶和機(jī)構(gòu)訪問和調(diào)用 MdrDB 耐藥性數(shù)據(jù)庫。
對于一款新藥來說,研發(fā)投入大、周期長、失敗率高,注定是一個向死而生的過程。數(shù)據(jù)顯示,藥物從最初的實(shí)驗(yàn)研究到最終上市,平均要花費(fèi)12年時(shí)間、60多億美元、6000多個實(shí)驗(yàn),才能最終得到1個新藥。
數(shù)據(jù)樣本不足,更是成為全世界研發(fā)新藥面臨的最大問題?;诖?,騰訊量子實(shí)驗(yàn)室此前推出了全球領(lǐng)先的耐藥性數(shù)據(jù)庫MdrDB,相關(guān)內(nèi)容已經(jīng)收錄于Nature 旗下的 Communications Chemistry 期刊。
耐藥性是醫(yī)藥領(lǐng)域面臨的一大挑戰(zhàn),突變誘導(dǎo)耐藥性是導(dǎo)致藥物治療失效的重要原因之一。騰訊量子實(shí)驗(yàn)室構(gòu)建的MdrDB耐藥性數(shù)據(jù)庫致力于提供大量與蛋白質(zhì)結(jié)構(gòu)突變誘導(dǎo)的耐藥性相關(guān)的數(shù)據(jù)。
該數(shù)據(jù)庫包括了野生型和突變型蛋白質(zhì)-配體復(fù)合物的結(jié)構(gòu)信息,以及突變前后的結(jié)合親和力變化等生化特征。通過MdrDB,科學(xué)家可以更好地理解突變誘導(dǎo)的耐藥性機(jī)制,開發(fā)聯(lián)合治療策略,并發(fā)現(xiàn)全新的藥物。
數(shù)據(jù)庫目前包含了來自240種蛋白質(zhì)、2503個突變和440種藥物組合的100537個樣本。與現(xiàn)有公開的耐藥性數(shù)據(jù)庫相比,具有多項(xiàng)優(yōu)勢。首先,它是目前最大的蛋白質(zhì)突變誘導(dǎo)耐藥數(shù)據(jù)庫,涵蓋了各種蛋白質(zhì)家族的突變信息。其次,提供了結(jié)構(gòu)化的數(shù)據(jù),有助于研究蛋白質(zhì)突變和耐藥性建模。此外,還包含多種突變類型,包括單點(diǎn)突變和復(fù)雜的多位點(diǎn)突變,進(jìn)一步豐富了數(shù)據(jù)庫的內(nèi)容。
通過使用MdrDB數(shù)據(jù)庫,研究人員在耐藥性預(yù)測方面取得了顯著進(jìn)展。此前,由于數(shù)據(jù)少、不平衡以及缺乏結(jié)構(gòu)信息等問題,耐藥性的精確預(yù)測一直是一個巨大的挑戰(zhàn)。在構(gòu)建了MdrDB數(shù)據(jù)庫后,作者也考察了該數(shù)據(jù)庫對耐藥性預(yù)測的AI算法的幫助。結(jié)果發(fā)現(xiàn),幾乎所有使用MdrDB作為訓(xùn)練數(shù)據(jù)的經(jīng)典機(jī)器學(xué)習(xí)模型在酪氨酸激酶抑制劑耐藥性預(yù)測問題上都取得了顯著的性能提升。這為開發(fā)更精準(zhǔn)的耐藥性預(yù)測方法提供了更強(qiáng)大的底層工具。
的發(fā)布為科學(xué)家們提供了寶貴的資源,將推動更多的研究人員共同開展耐藥性研究。通過更全面、更方便地獲取蛋白質(zhì)結(jié)構(gòu)和配體結(jié)合親和力數(shù)據(jù),我們可以加深對突變誘導(dǎo)的耐藥性機(jī)制的理解,提高對全新突變的預(yù)測能力,并為耐藥性預(yù)測提供更有效的計(jì)算方法。
的發(fā)布標(biāo)志著耐藥性研究邁出了重要一步,有望為未來藥物開發(fā)和治療方案的優(yōu)化帶來新的希望。騰訊量子實(shí)驗(yàn)室負(fù)責(zé)人張勝譽(yù)表示,“AI for Science的一個常見困難是數(shù)據(jù)的數(shù)量不足,內(nèi)容和標(biāo)準(zhǔn)也各異。這項(xiàng)工作在幫助補(bǔ)齊AI科學(xué)中數(shù)據(jù)短板的方向邁出堅(jiān)實(shí)的一步,緩解了相關(guān)問題中AI算法過擬合和泛化差的普遍性問題。通過提供更大規(guī)模的數(shù)據(jù)集,我們致力于幫助改善AI算法的性能,提高其在科學(xué)研究中的泛化能力,進(jìn)一步推動AI在醫(yī)藥領(lǐng)域的發(fā)展和應(yīng)用,以更好地服務(wù)人類健康。”
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP