每日經(jīng)濟(jì)新聞 2023-07-06 10:33:52
每經(jīng)編輯 畢陸名
為了控制、引導(dǎo)超級智能對齊問題,OpenAI周三(5日)表示,組建了一支人工智能對齊團(tuán)隊Superalignment。同時該團(tuán)隊也是對OpenAI現(xiàn)有工作的補(bǔ)充,可提升ChatGPT等產(chǎn)品的安全性,在4年內(nèi)解決超級智能對齊問題。
超級智能將是人類發(fā)明的最具影響力的技術(shù)之一,可以幫助我們解決世界上許多難題。但超級智能的巨大力量也可能非常危險,并導(dǎo)致人類失去控制權(quán),甚至滅絕人類。雖然超級智能還很遙遠(yuǎn),但OpenAI認(rèn)為,10年之內(nèi)就很有可能實(shí)現(xiàn)。
目前,OpenAI還沒有一個明確的解決方案來引導(dǎo)或控制超級人工智能。當(dāng)下可控制的人工智能技術(shù),例如,根據(jù)人類反饋進(jìn)行強(qiáng)化學(xué)習(xí),依賴于人類監(jiān)督的AI能力等。但人類無法可靠地監(jiān)督,比我們聰明多的AI系統(tǒng),因此,我們目前的對齊技術(shù)無法擴(kuò)展到超級智能,需要新的科學(xué)技術(shù)突破。
為了控制、引導(dǎo)超級智能對齊問題,OpenAI組建了一支由Ilya Sutskever(OpenAI聯(lián)合創(chuàng)始人兼首席科學(xué)家)和Jan Leike領(lǐng)導(dǎo)的人工智能對齊團(tuán)隊——Superalignment。
同時該團(tuán)隊也是對OpenAI現(xiàn)有工作的補(bǔ)充,可提升ChatGPT等產(chǎn)品的安全性,包括非法濫用、經(jīng)濟(jì)破壞、虛假信息、偏見和歧視、數(shù)據(jù)隱私和其他可能出現(xiàn)的問題。
他們預(yù)測,超智能AI(即比人類更聰明的系統(tǒng))可能在這個十年(2030年前)就會到來,人類將需要比目前更好的技術(shù)來控制超智能AI,因此需要在所謂的“一致性研究”方面取得突破,該研究的重點(diǎn)是確保人工智能對人類有益。
根據(jù)他們的說法,在微軟(Microsoft)的支持下,OpenAI將拿出未來四年所獲算力的20%用于解決AI失控的問題。此外,該公司正在組建一個新的團(tuán)隊來組織這項工作,稱為超級一致性團(tuán)隊。
據(jù)悉,該團(tuán)隊的目標(biāo)是創(chuàng)建一個“人類級別”的AI研究人員,然后通過大量的計算能力進(jìn)行擴(kuò)展。OpenAI表示,這意味著他們將使用人類反饋來訓(xùn)練AI系統(tǒng),訓(xùn)練AI系統(tǒng)來輔助人類評估,然后最終訓(xùn)練AI系統(tǒng)進(jìn)行實(shí)際的一致性研究。
建立一個大致達(dá)到人類水平的自動對齊系統(tǒng)。然后,可以使用大量算力來擴(kuò)展工作,并調(diào)整超級智能。
1、開發(fā)可擴(kuò)展的訓(xùn)練方法:為了針對人類難以評估的任務(wù)提供訓(xùn)練方法,可以通過人工智能系統(tǒng)來協(xié)助評估,其他人工智能系統(tǒng)(可擴(kuò)展的監(jiān)督)。此外,OpenAI希望了解和控制其模型,將監(jiān)督應(yīng)用到無法監(jiān)督的任務(wù)(泛化)上。
2、驗(yàn)證生成的模型:為了驗(yàn)證系統(tǒng)的一致性,OpenAI將自動搜索有問題的行為(穩(wěn)定性)和有問題的內(nèi)部結(jié)構(gòu)(自動可解釋性)。
3、對整個對齊管道進(jìn)行壓力測試:可以通過故意訓(xùn)練未對準(zhǔn)的模型,來測試整個安全流程,并確認(rèn)技術(shù)檢測到最差的未對準(zhǔn)類型(對抗性測試)。
OpenAI預(yù)計,隨著對超級智能對齊了解越來越多,研究重點(diǎn)將會發(fā)生重大變化,可能會增加全新的研究領(lǐng)域。
未來,會分享更多有關(guān)技術(shù)研究路線圖的信息。
每日經(jīng)濟(jì)新聞綜合OpenAI官網(wǎng)
封面圖片來源:視覺中國
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP