每日經(jīng)濟新聞 2024-03-12 21:51:40
◎ 阿爾特曼、黃仁勛在不同場合表示,AGI或在五年內(nèi)實現(xiàn)。
每經(jīng)記者 李孟林 每經(jīng)編輯 蘭素英
“五年內(nèi),AGI很可能就會到來。”這不是科幻小說的情節(jié),而是業(yè)界大佬的預(yù)言。
近日,隨著Anthropic最新一代大模型Claude 3被曝表現(xiàn)出“自我意識”,以及馬斯克正式起訴OpenAI及其首席執(zhí)行官山姆•阿爾特曼,AGI(通用人工智能)再次成為AI屆熱議的話題。在對OpenAI的起訴書中,馬斯克稱OpenAI的GPT-4系統(tǒng)已經(jīng)實現(xiàn)了AGI,不過OpenAI直接予以了否認。
這一系列事件讓外界產(chǎn)生了一種錯覺:AGI似乎真的不遠了。阿爾特曼和英偉達CEO黃仁勛也相繼表示,AGI可能在5年內(nèi)實現(xiàn)。
然而,在沸沸揚揚的議論中,何謂AGI仍然是一個莫衷一是的概念。作為DeepMind的首席AGI科學(xué)家,Shane Legg曾是首批將這一概念引入計算機科學(xué)界的人之一。近期,他與同事聯(lián)合發(fā)表了一篇論文,從六個方面定義了AGI,并劃分了六個等級,為公眾厘清AGI提供了參考。
由OpenAI前員工創(chuàng)建、獲亞馬遜大力支持的初創(chuàng)企業(yè)Anthropic最近推出了最新一代的大模型Claude 3.0,在許多關(guān)鍵指標(biāo)與OpenAI最新的GPT-4打平甚至超越后者。
更有趣的是,該公司的員工Alex Albert在X平臺(原推特)上表示,該系列模型的最強版本Claude 3 Opus在測試過程中,識別到人類在對其進行測試,展現(xiàn)出“自我意識”的跡象。
具體而言,測試人員在一大堆話題中插入了一個完全不相關(guān)的披薩配料問題,Claude 3 Opus表示:“我懷疑這個披薩配料‘事實’插入進來是一個玩笑,或者測試我是否在集中注意力,因為它跟其他問題完全不相匹配。”不少AI研究人員表示,這個模型展現(xiàn)出了“對思考進行思考”的元認知能力,自我意識進入到了一個新水平,似乎是朝向更高級的AGI邁了一步。
在此之前,OpenAI推出了“王炸級”文本生視頻模型Sora,并將其定義為可以生成視頻的世界模型(World Simulators),并認為這是打造通用世界模型的潛在方法之一。圖靈獎得主、Meta的首席AI科學(xué)家楊力昆(Yann LeCun)一直認為,要實現(xiàn)AI的智能突破,需要一個能理解周遭世界的世界模型,才能最終通往AGI,而這也正是當(dāng)前的大語言模型所缺乏的。
除開技術(shù)方面的進步,近期馬斯克對OpenAI的起訴也將焦點之一對準了AGI。馬斯克在起訴書中表示,GPT-4已經(jīng)可以被當(dāng)作早期的AGI,但是其內(nèi)部細節(jié)只有OpenAI和微軟才知道。這一說法是基于微軟自己的評估。2023年3月,微軟研究員在一份預(yù)印本論文中表示,GPT-4在很多能力上與人類持平或更強,已經(jīng)有了AGI的“火花”。
所有這些讓外界對AGI有了更強的期待,難道AGI真的離走進現(xiàn)實不遠了?對此,部分業(yè)界大佬似乎有著樂觀的預(yù)期。
OpenAI CEO阿爾特曼在電子書《我們的AI旅途》中的采訪中提到,AGI可能在五年內(nèi)實現(xiàn)。“5年左右,也許會稍長一些。沒有人能說出一個確切的時間,也沒有人知道它對社會的影響到底是什么。”阿爾特曼表示。“當(dāng)AI能夠獨立完成創(chuàng)新的科學(xué)突破時,它就能被稱為AGI了。”
與阿爾特曼不謀而合的還有英偉達的CEO黃仁勛。他在近期的一個論壇上表示,如果把AGI標(biāo)準定為通過人類創(chuàng)制的各種測試的話,那么不出5年,AI就可以通過任何人類測試。當(dāng)前的AI可以通過律師考試,但對胃腸病學(xué)等專業(yè)醫(yī)療測試仍然表現(xiàn)不佳。
但在樂觀的氛圍之外,也有人在潑冷水。紐約大學(xué)教授Gary Marcus就表示,依靠不斷提高大模型的數(shù)據(jù)量并非解決AI現(xiàn)存問題的方法,芯片領(lǐng)域的摩爾定律不一定會在AI領(lǐng)域復(fù)現(xiàn),大模型并非通往AGI的答案,AI需要的是范式轉(zhuǎn)換。楊力昆同樣認為,要實現(xiàn)人類水平的AI,當(dāng)前的大語言模型是走了岔路,因為其實質(zhì)是預(yù)測下一個單詞,而無法謀劃和推理。
1965年,AI研究先驅(qū)Herbert Simon曾樂觀地預(yù)測,20年之內(nèi)機器就可以完成人類的任何工作。很顯然,現(xiàn)實離Simon的預(yù)測相差甚遠。
AGI到底是什么?
正如許多前沿科學(xué)的關(guān)鍵概念一樣,AGI的標(biāo)準可謂眾說紛紜,且其內(nèi)涵一直在隨著研究的進展不斷變化。但有一點可以肯定的是,正如其名字“通用人工智能”所示,AGI一定是相對只能完成某種特定任務(wù)如下圍棋或者翻譯的“狹義”AI而言的。
在AGI概念之前,學(xué)術(shù)界對達到人類水平或以上的討論集中在哲學(xué)界,如著名的“圖靈測試”或哲學(xué)家約翰•賽爾提出的“強人工智能”等概念。1997年,北卡羅萊納大學(xué)的物理學(xué)家Mark Gubrud首次提出了AGI這個概念。在他的定義中,AGI指的是在復(fù)雜程度和速度上可以和人腦媲美的AI系統(tǒng),可以獲取一般性知識,并以其為基礎(chǔ)進行操作和推理,可以在任何工業(yè)或軍事活動中發(fā)揮人類智力的作用。
OpenAI在其組織章程中,將AGI定義為“可以在大多數(shù)經(jīng)濟上有價值的工作中超越人類的高級自動系統(tǒng)”。谷歌研究院副總裁Blaise Agüera y Arcas則認為,AGI的關(guān)鍵指標(biāo)在于“通用性”,既然當(dāng)前的大模型已經(jīng)能夠討論大多數(shù)問題,處理多種模態(tài)的信息輸入輸出,這就是已經(jīng)是AGI了。
“如果你邀請100個AI專家來定義AGI,你可能會得到100個相互關(guān)聯(lián)但又不同的定義。”2023年11月,知名AI公司DeepMind聯(lián)合創(chuàng)始人、首席AGI科學(xué)家的Shane Legg及公司研究人員在一篇論文中表示。2002年,Legg便開始在計算機界普及AGI概念,按照他當(dāng)時的定義,AGI是指在認知任務(wù)上能取得類人表現(xiàn)的機器智能。
而在最新的這篇論文中,Legg及其同事試圖建立一個評估AGI的概念框架,是當(dāng)前AI界對于AGI問題最深入的探討之一。他們梳理了現(xiàn)在的AGI定義,并從中提取了6個AGI應(yīng)該滿足的原則,然后以類似自動駕駛分級的方式,給AGI的性能劃分了五個階段。
然而,這篇論文并沒有給出AGI的定義,只是給出了定義AGI的六項原則。具體而言:
1、注重能力,而非過程:即只考慮AI系統(tǒng)完成任務(wù)的能力,而不考慮系統(tǒng)的推理過程是否像人腦一樣思考,也不討論系統(tǒng)是有“意識”和“感知能力”。
2、注重通用性與性能:既要考慮AI系統(tǒng)的通用性(寬度),也要考慮其性能水平(深度)。Blaise Agüera y Arcas的標(biāo)準就過度關(guān)注通用性,而忽視了性能標(biāo)準。
3、注重認知與元認知任務(wù):即聚焦在非實體的“認知”活動上,暫不考慮AI系統(tǒng)“具身化”到機器人系統(tǒng),從而在現(xiàn)實世界操作的能力。
4、專注于潛力而不是實際應(yīng)用:即AI系統(tǒng)需要具備某種能力的潛能即可,不需要在現(xiàn)實世界中達到此種效果,因為后者涉及社會、法律、倫理等多種因素制約。
5、重視實際適用性:指評價AGI的標(biāo)準應(yīng)該是完成現(xiàn)實世界中人類覺得有價值的任務(wù)。
6、關(guān)注實現(xiàn)AGI的路徑,而非單一終點:即將AGI的能力分為多個層級,而非單個的門檻標(biāo)準,從而能容納多種AGI的定義方式。
按照最后一個原則,該論文也將AGI分為了L0到L5六個等級,分別為:無AI,初現(xiàn),合格,專家,大師和超人類。論文認為,2023年推出的ChatGPT、谷歌Bard、Meta的Llama 2,即當(dāng)前主要的大模型,還處在L1階段,也就是和未經(jīng)訓(xùn)練的普通人差不多或稍好一點。后四個等級的AGI都還沒有出現(xiàn)。接下來的L2到L5級別,分別對應(yīng)超越50%、90%、99%和100%的有技巧成年人。
封面圖片來源:新華社記者 金立旺 攝
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP