要聞

推理能力接近類人水平？OpenAI神秘項(xiàng)目“草莓”被曝光！內(nèi)部人士曾警告：可能威脅全人類......

每日經(jīng)濟(jì)新聞 2024-07-13 07:20:27

每經(jīng)編輯杜宇

新近消息顯示，OpenAI正在讓人工智能（AI）大模型的能力更加接近類人的推理水平。

據(jù)知情人士和媒體查閱的內(nèi)部文件，ChatGPT開(kāi)發(fā)商O(píng)penAI正在一個(gè)代號(hào)為“草莓”的項(xiàng)目中開(kāi)發(fā)一種新的人工智能模型。該項(xiàng)目的細(xì)節(jié)此前從未被報(bào)道過(guò)，目前該公司正在努力展示其提供的模型類型能夠提供高級(jí)推理能力。這位知情人士說(shuō)，即使在OpenAI內(nèi)部，“草莓”的工作原理也是一個(gè)嚴(yán)格保密的秘密。

知情人士還透露，該內(nèi)部文件描述了一個(gè)使用Strawberry模型的項(xiàng)目，目的是使該公司的人工智能不僅能夠生成查詢的答案，而且能夠提前做好足夠的計(jì)劃，自主、可靠地在互聯(lián)網(wǎng)上導(dǎo)航，以執(zhí)行OpenAI所說(shuō)的“深度研究”。

圖片來(lái)源：視覺(jué)中國(guó)-VCG31N2008743681

OpenAI被問(wèn)及上述所說(shuō)的草莓技術(shù)時(shí)，OpenAI的發(fā)言人在一份聲明中表示：“我們希望自身AI 模型能夠像我們（人類）一樣看待和理解世界。持續(xù)研究新的AI能力是業(yè)界的常見(jiàn)做法，大家都相信這些系統(tǒng)的推理能力會(huì)隨著時(shí)間的推移而提高。”

雖然該發(fā)言人未直接回答有關(guān)草莓的問(wèn)題，但媒體稱，草莓項(xiàng)目此前名為Q*。而Q*正是去年被爆出OpenAI CEO突然被解雇宮斗大戲的導(dǎo)火索。

去年11月媒體稱，OpenAI代號(hào)Q*的項(xiàng)目實(shí)現(xiàn)重大突破，讓人類實(shí)現(xiàn)通用人工智能（AGI）的步伐大大提速，但OpenAI CEO 奧特曼可能沒(méi)有和董事會(huì)詳細(xì)披露Q*的進(jìn)展，這是董事會(huì)突然解雇奧特曼的一個(gè)原因。OpenAI的內(nèi)部人士向董事會(huì)致信警告，Q*的重大發(fā)現(xiàn)可能威脅全人類。

媒體稱，Q*可能具備GPT-4所不具備的基礎(chǔ)數(shù)學(xué)能力，或許意味著與人類智能相媲美的推理能力，網(wǎng)友推測(cè)，這可能代表OpenAI朝著其設(shè)定的AGI目標(biāo)邁出了一大步。

今年3月曝光的一份文件顯示，OpenAI計(jì)劃，在2027年以前，開(kāi)發(fā)出人類水平的AGI。OpenAI 2022年就開(kāi)始訓(xùn)練一個(gè)125萬(wàn)億參數(shù)的多模態(tài)模型，該模型名為Arrakis或Q*，原本計(jì)劃在2025年作為GPT-5發(fā)布，但因推理成本高而取消。OpenAI此后計(jì)劃，2027年發(fā)布的Q 2025（GPT-8）將實(shí)現(xiàn)完全的AGI。

人工智能（AI）研究者早就在爭(zhēng)論用什么標(biāo)準(zhǔn)判斷人類實(shí)現(xiàn)了通用人工智能（AGI）。OpenAI最近開(kāi)發(fā)了一套系統(tǒng)，“自定義”AI進(jìn)化等級(jí)，以此追蹤開(kāi)發(fā)人類級(jí)別AI的進(jìn)展。

美東時(shí)間7月11日周四，OpenAI的發(fā)言人稱，OpenAI在本周二的公司全體會(huì)議上與員工分享了新的分類系統(tǒng)，計(jì)劃與投資者和公司外部人士分享這些等級(jí)的信息。

OpenAI的系統(tǒng)劃分了五個(gè)AI水平，按一到五的數(shù)字由低到高排列等級(jí)。OpenAI的高管告訴員工，公司認(rèn)為目前自身產(chǎn)品處于第一級(jí)，但即將達(dá)到第二級(jí)，也就是，可以完成基本問(wèn)題解決任務(wù)的系統(tǒng)，類似于擁有博士學(xué)位但無(wú)法使用任何工具的人。

7月11日OpenAI的發(fā)言人表示，OpenAI一直在內(nèi)部測(cè)試新功能，這是業(yè)內(nèi)的常見(jiàn)做法。

對(duì)于OpenAI開(kāi)發(fā)AI分級(jí)系統(tǒng)的消息，有網(wǎng)友表示，擔(dān)心AI超越人類可能帶來(lái)的風(fēng)險(xiǎn)，不知道那對(duì)經(jīng)濟(jì)和就業(yè)有何影響。

今年5月，OpenAI發(fā)布新旗艦AI模型GPT-4o。它面向所有用戶、包括免費(fèi)用戶，最快232毫秒響應(yīng)音頻輸入，平均響應(yīng)時(shí)間和人類相似；相比GPT-4 Turbo速度快兩倍，成本降低50%，API速率限制提高五倍。

上月傳出GPT-5可能大幅推遲上線的消息。OpenAI首席技術(shù)官M(fèi)ira Murati稱，GPT-5有望在2025年底或2026年初推出。這一發(fā)布時(shí)間與早期傳聞?dòng)休^大出入，市場(chǎng)曾預(yù)測(cè)GPT-5可能在2023年底或2024年夏季發(fā)布，

不過(guò)，Murati透露GPT-5的性能將迎來(lái)重大飛躍，在特定任務(wù)中達(dá)到博士級(jí)智能水平。據(jù)悉，GPT-5內(nèi)部代號(hào)為“Gobi”和“Arrakis”，是一個(gè)具有52萬(wàn)億參數(shù)的多模態(tài)模型，上一代GPT-4參數(shù)約為2萬(wàn)億。這一龐大的參數(shù)規(guī)模暗示了其潛在的強(qiáng)大能力。

Murati將GPT-4到GPT-5的進(jìn)步比作從高中水平到大學(xué)水平的跨越，表明新模型在復(fù)雜性和能力上將有顯著提升。

美東時(shí)間6月27日，OpenAI公布，其研究人員訓(xùn)練了一個(gè)基于GPT-4的模型，它被稱為CriticGPT，用于捕捉ChatGPT代碼輸出中的錯(cuò)誤。簡(jiǎn)單來(lái)說(shuō)就是，CriticGPT讓人能用GPT-4查找GPT-4的錯(cuò)誤。它可以寫(xiě)出使用者對(duì)ChatGPT響應(yīng)結(jié)果的批評(píng)評(píng)論，從而幫助人類訓(xùn)練者在RLHF期間發(fā)現(xiàn)錯(cuò)誤。

OpenAI發(fā)現(xiàn)，如果通過(guò)CriticGPT獲得幫助審查ChatGPT編寫(xiě)的代碼，人類訓(xùn)練師的審查效果比沒(méi)有獲得幫助的人強(qiáng)60%。OpenAI稱，正著手將類似CriticGPT的模型集成到旗下RLHF標(biāo)記管道中，為自己的訓(xùn)練師提供明確的AI幫助。

OpenAI稱，因?yàn)闆](méi)有更好的工具，所以人們目前難以評(píng)估高級(jí)的AI系統(tǒng)的表現(xiàn)。而CriticGPT意味著，OpenAI向能夠評(píng)估高級(jí)AI系統(tǒng)輸出的目標(biāo)邁進(jìn)了一步。

每日經(jīng)濟(jì)新聞綜合公開(kāi)資料

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

Ai OpenAI

上一篇文章

在岸人民幣對(duì)美元夜盤(pán)收?qǐng)?bào)7.2500，較上一交易日夜盤(pán)收漲76個(gè)基點(diǎn)

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

發(fā)射過(guò)程出現(xiàn)故障美聯(lián)邦航空管理局暫?！矮C鷹9”發(fā)射任務(wù)

相關(guān)文章