每日經(jīng)濟(jì)新聞 2024-04-17 12:45:20
每經(jīng)記者 李孟林 每經(jīng)編輯 何小桃 蘭素英
“大模界”是每日經(jīng)濟(jì)新聞推出一檔專注生成式AI與大模型技術(shù)的前沿科技報(bào)道欄目。
在這里,我們將聚焦生成式AI技術(shù)浪潮,展現(xiàn)從文字、圖像、音頻、視頻的大模型如何編織數(shù)字化世界。
在這里,我們將解碼、評測國內(nèi)外各類大模型,探究它們?nèi)绾纬蔀樽兏锔餍懈鳂I(yè)的重要力量。
在這里,我們將關(guān)注AIGC行業(yè)發(fā)展,聯(lián)手行業(yè)領(lǐng)軍人物和頂尖專家,共同揭示最新產(chǎn)品創(chuàng)新和技術(shù)突破,前瞻未來發(fā)展趨勢。
歡迎關(guān)注“大模界”,您將見證AIGC如何重塑內(nèi)容生態(tài),如何以前沿之力推動(dòng)社會(huì)進(jìn)步。讓我們共同開啟一場關(guān)于AI新紀(jì)元的無限旅程!
《2024 年人工智能指數(shù)報(bào)告》 圖片來源:報(bào)告截圖
當(dāng)?shù)貢r(shí)間4月15日,斯坦福大學(xué)“以人為本”人工智能研究院(Human Centered Artificial Intelligence,簡稱HAI)發(fā)布了第七個(gè)年度AI Index報(bào)告,這是關(guān)于AI行業(yè)現(xiàn)狀的最全面的報(bào)告之一。
報(bào)告稱,今年的報(bào)告是迄今為止覆蓋面最廣的,恰逢AI對社會(huì)的影響力達(dá)到前所未有的重要時(shí)刻。從內(nèi)容上看,報(bào)告長達(dá)300多頁,不僅追蹤了AI技術(shù)的進(jìn)步情況、公眾感知度、AI訓(xùn)練成本、倫理監(jiān)管等常規(guī)話題,也加入了AI對科學(xué)和醫(yī)學(xué)領(lǐng)域影響的新章節(jié)。
圖片來源:報(bào)告截圖
HAI成立于2019年,由著名AI科學(xué)家李飛飛與哲學(xué)教授約翰·埃切曼迪聯(lián)合擔(dān)任院長,致力于推動(dòng)人工智能領(lǐng)域的跨學(xué)科合作。今年的AI Index報(bào)告同樣秉承這樣的精神,邀請來自于斯坦福大學(xué)多個(gè)學(xué)院的不同學(xué)科專家撰寫,并得到了谷歌、OpenAI等業(yè)界巨頭的支持,以及埃森哲、GitHub、麥肯錫等機(jī)構(gòu)在研究和分析上的協(xié)助。
AI Index報(bào)告旨在用無偏見、嚴(yán)格篩選、廣泛采納的數(shù)據(jù),為政、學(xué)、商和大眾提供全面且精細(xì)的AI趨勢解讀,已成為各國政策制定者、學(xué)院研究和新聞媒體參考的權(quán)威行業(yè)報(bào)告。
以下是《每日經(jīng)濟(jì)新聞》記者梳理的十大關(guān)鍵信息:
1.開源大模型數(shù)量激增,但性能不及閉源
整個(gè)2023年共有149個(gè)基礎(chǔ)模型發(fā)布,是2022年發(fā)布數(shù)量的兩倍以上。在這些新發(fā)布的模型中,65.7%是開源的,相比之下,2022年僅為44.4%,2021年則為33.3%。然而,在10個(gè)AI基準(zhǔn)測試中,閉源模型的性能優(yōu)于開源,性能優(yōu)越的中位數(shù)為24.2%。
圖片來源:報(bào)告截圖
谷歌在2023年發(fā)布的基礎(chǔ)模型最多,達(dá)18個(gè),其次是Meta(11個(gè))、Microsoft(9個(gè))、OpenAI(7個(gè))。2023年發(fā)布基礎(chǔ)模型最多的學(xué)術(shù)機(jī)構(gòu)是加州大學(xué)伯克利分校(3個(gè))。
圖片來源:報(bào)告截圖
2023年,企業(yè)界發(fā)布了51個(gè)重要的機(jī)器學(xué)習(xí)模型,而學(xué)術(shù)界僅貢獻(xiàn)了15個(gè)。此外,2023年產(chǎn)學(xué)研合作成果的模型數(shù)量也創(chuàng)下新高,達(dá)到21個(gè)。
2.AI模型訓(xùn)練“燒錢”加劇
最先進(jìn)的AI模型的訓(xùn)練成本已達(dá)到前所未有的水平。例如,OpenAI的GPT-4訓(xùn)練據(jù)估計(jì)耗費(fèi)了價(jià)值7800萬美元的計(jì)算資源,而谷歌Gemini Ultra的訓(xùn)練成本則高達(dá)1.91億美元。作為對比,2017年Transformer模型訓(xùn)練成本約為900美元。2019年發(fā)布的RoBERTa Large訓(xùn)練成本約為16萬美元。
圖片來源:報(bào)告截圖
3.頂級模型數(shù)量美國領(lǐng)先,專利數(shù)量中國領(lǐng)跑
從區(qū)域競爭來看,美國在頂級AI模型方面領(lǐng)先于中國、歐盟和英國。2023年,來自美國機(jī)構(gòu)的知名AI模型數(shù)量為61個(gè),超過歐盟的21個(gè)和中國的15個(gè)。
圖片來源:報(bào)告截圖
不過,在AI專利方面,中國處于領(lǐng)先位置。2022年,中國以61.1%的比例領(lǐng)跑全球AI專利來源地,遠(yuǎn)超美國(20.9%)。對比2010年,當(dāng)時(shí)美國在AI專利方面的占比高達(dá)54.1%。
圖片來源:報(bào)告截圖
4.AI在復(fù)雜任務(wù)上的表現(xiàn)仍落后人類
在圖像分類、視覺推理和英語理解等方面,AI的表現(xiàn)已經(jīng)優(yōu)于人類。然而,在更復(fù)雜的任務(wù)上,例如競賽級別的數(shù)學(xué)、視覺常識(shí)推理和規(guī)劃,AI的表現(xiàn)仍然落后于人類。
圖片來源:報(bào)告截圖
與此同時(shí),在既有的基準(zhǔn)測試(例如ImageNet、SQuAD 和 SuperGLUE)上,AI模型的性能已經(jīng)趨于飽和。2023年出現(xiàn)了幾個(gè)具有挑戰(zhàn)性的新基準(zhǔn)測試,包括用于編碼的SWE-bench、用于圖像生成的HEIM、用于通用推理的MMMU、用于道德推理的 MoCa、用于基于代理的行為的AgentBench以及用于檢測幻覺的HaluEval。
5.缺乏嚴(yán)格、標(biāo)準(zhǔn)化的AI責(zé)任評估方法
隨著深度偽造、版權(quán)糾紛、隱私安全等問題逐漸凸顯,報(bào)告顯示,當(dāng)前嚴(yán)重缺乏嚴(yán)格且標(biāo)準(zhǔn)化的負(fù)責(zé)任AI評估方法。OpenAI、谷歌和 Anthropic等行業(yè)領(lǐng)袖使用不同的負(fù)責(zé)任AI基準(zhǔn)測試來評估他們的模型,這種做法使人們難以系統(tǒng)地比較頂級AI模型的風(fēng)險(xiǎn)和局限性。
圖片來源:報(bào)告截圖
報(bào)告新引入的“基礎(chǔ)模型透明度指數(shù)”顯示,AI開發(fā)企業(yè)缺乏透明度,尤其是在訓(xùn)練數(shù)據(jù)和方法披露方面。這種開放性的缺乏阻礙了人們進(jìn)一步了解AI系統(tǒng)的嚴(yán)密性和安全性。
6.生成式AI投資增長近8倍
盡管2023年整個(gè)AI領(lǐng)域的投資有所下降,但生成式AI領(lǐng)域的私人投資卻在激增,在2022年的基礎(chǔ)上幾乎增長了八倍,達(dá)到252億美元。OpenAI、Anthropic、Hugging Face和Inflection等領(lǐng)軍企業(yè)都宣布了大規(guī)模的融資輪次。
圖片來源:報(bào)告截圖
從區(qū)域來看,美國作為AI私人投資的領(lǐng)導(dǎo)者,優(yōu)勢地位進(jìn)一步擴(kuò)大。2023年,美國的AI投資達(dá)到672億美元,增長22.1%,歐盟和中國的AI投資處于下滑態(tài)勢。盡管全球AI投資連續(xù)第二年下降,但新成立的AI公司數(shù)量卻激增至1812家,比2022年增長了40.6%。
7.AI降本增效能力初顯
麥肯錫2023年的報(bào)告顯示,目前55%的受訪組織至少在一個(gè)業(yè)務(wù)部門或職能中使用了AI(包括生成式AI),高于2022年的50%和2017年的20%。42%的受訪組織報(bào)告實(shí)施AI后降低了成本,59%的受訪組織報(bào)告了收入增長。與2022年相比,報(bào)告成本降低的受訪組織比例增加了10個(gè)百分點(diǎn)。
圖片來源:報(bào)告截圖
2023年,多項(xiàng)研究評估了AI對勞動(dòng)力的影響,表明AI使員工能夠更快地完成任務(wù)并提高產(chǎn)出質(zhì)量。這些研究還展示了AI彌合低技能和高技能工人之間技能差距的潛力。
8.AI推動(dòng)科學(xué)進(jìn)步,醫(yī)學(xué)尤為突出
2023年,多個(gè)重大的科學(xué)相關(guān)AI應(yīng)用出現(xiàn),包括提高算法排序效率的AlphaDev,促進(jìn)材料發(fā)現(xiàn)過程的GNoME。
在醫(yī)學(xué)領(lǐng)域,2023年出現(xiàn)了多個(gè)重要的AI醫(yī)療系統(tǒng),例如用于增強(qiáng)大流行預(yù)測的EVEscape,以及輔助AI驅(qū)動(dòng)將基因突變分類的AlphaMissence。AI正越來越多地被用于推動(dòng)醫(yī)學(xué)進(jìn)步。AI系統(tǒng)在MedQA基準(zhǔn)測試(評估人工智能臨床知識(shí)水平的關(guān)鍵測試)上的表現(xiàn)也取得了顯著進(jìn)步,2023年表現(xiàn)最出色的模型GPT-4 Medprompt準(zhǔn)確率達(dá)到了90.2%,比2022年的最高分高出 22.6個(gè)百分點(diǎn)。
圖片來源:報(bào)告截圖
9.監(jiān)管力度急劇增強(qiáng)
2023年有25項(xiàng)AI相關(guān)法規(guī)出臺(tái),同比增長56.3%。美國和歐盟在AI政策方面取得里程碑式進(jìn)展。歐盟就《人工智能法》條款達(dá)成一致,美國總統(tǒng)拜登簽署了一份關(guān)于AI的行政命令,這是當(dāng)年美國最引人注目的AI政策舉措。
圖片來源:報(bào)告截圖
全球立法程序中提及AI的次數(shù)幾乎翻了一番,從2022年的1247次增加到2023年的2175次。2023年有49個(gè)國家的立法程序中提到了AI,而且每個(gè)大洲至少有一個(gè)國家在2023年討論了AI。對AI的限制性立法已經(jīng)成為全球趨勢。
10.公眾對AI的認(rèn)知在提高,緊張感也在增加
一份來自益普索的調(diào)查顯示,2023年,認(rèn)為AI將在未來三到五年內(nèi)顯著影響其生活的人口比例從60%上升到66%。多倫多大學(xué)的一項(xiàng)國際調(diào)查顯示,63%的受訪者知道ChatGPT。在那些知道的人中,大約有一半的人每周至少使用ChatGPT一次。
對AI感到緊張的人數(shù)比例在增加。益普索的調(diào)查中,有52%的人對AI產(chǎn)品和服務(wù)感到緊張,比2022年增加了13個(gè)百分點(diǎn)。在美國,皮尤研究中心的數(shù)據(jù)表明,有52%的美國人表示對AI的擔(dān)憂比興奮更多,高于2022年的38%。
公眾對AI帶來的經(jīng)濟(jì)影響不太樂觀。在益普索的調(diào)查中,37%的受訪者認(rèn)為AI將改善他們的工作,34%的人認(rèn)為AI將促進(jìn)經(jīng)濟(jì),32%的人認(rèn)為AI將促進(jìn)就業(yè)市場。
圖片來源:報(bào)告截圖
報(bào)告也報(bào)道了一些有趣的人口分布特點(diǎn)。比如,年輕人比老年人更相信AI對娛樂的豐富作用,高收入和教育程度高的人群對AI的正面潛力也更為樂觀。包括德國、荷蘭、澳大利亞、比利時(shí)、加拿大和美國等西方國家對AI產(chǎn)品和服務(wù)的正面評價(jià)最低,但這一現(xiàn)象在2023年有所好轉(zhuǎn)。
記者|李孟林
編輯|何小桃 蘭素英 蓋源源
校對|孫志成
|每日經(jīng)濟(jì)新聞 ?nbdnews??原創(chuàng)文章|
未經(jīng)許可禁止轉(zhuǎn)載、摘編、復(fù)制及鏡像等使用
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP