每日經(jīng)濟新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

“元年”之后,生成式AI又將走向何方:多模態(tài)、開源化、強監(jiān)管成關鍵詞

每日經(jīng)濟新聞 2023-12-28 08:58:36

◎展望2024年的AI領域發(fā)展,多位業(yè)界專家在接受《每日經(jīng)濟新聞》記者采訪時認為,多模態(tài)模型與視頻生成能力、開源閉源之爭和AI智能體將最受關注,同時AI的安全性與監(jiān)管問題將繼續(xù)成為熱點話題。

每經(jīng)記者 李孟林    每經(jīng)編輯 蘭素英    

一年多以前,如果有人告訴你,他可以用一句話就能在數(shù)秒之間生成一首詩,一幅畫,甚至一部電影,你肯定覺得是天方夜譚,腦洞開得太大。然而,隨著ChatGPT的出現(xiàn),這樣的想象步入了現(xiàn)實。

2023年,毫無疑問是AI的一年。在這一年里,以ChatGPT為首的生成式AI技術在全球點燃研發(fā)浪潮,各大科技公司競相入局,從文本到圖像,從音樂到視頻,從游戲到教育,無一領域不在大力推動AI技術的應用,呈現(xiàn)出“百花齊放”的生動局面。

生成式AI企業(yè)也獲得了前所未有的關注和投資,“盤活”了創(chuàng)投行業(yè)。據(jù)AI投資者 Nathan Benaich 和 Air Street Capital 團隊制作的《2023年AI現(xiàn)狀》報告,截至2023年10月2日,專注研發(fā)生成式AI應用的初創(chuàng)企業(yè)今年累計獲得了近180億美元的風投資金,較2022年整年增長超360%。

圖片來源:《2023年AI現(xiàn)狀》報告截圖

然而,這一年也出現(xiàn)了一些戲劇性事件,如AI大佬聯(lián)名發(fā)表呼吁暫停研究的公開信以及OpenAI“宮斗”,引發(fā)人們對生成式AI的質疑和擔憂。這些事件讓外界看到了生成式AI的另一面,意識到了生成式AI的復雜性和監(jiān)管的必要性。

進入2024年,AI注定仍將成為全球關注的焦點。CNBC技術執(zhí)行委員會于今年11月底及12月初對 22 名頂級技術官員進行的抽樣調查顯示,沒有一名受訪者表示他們不會在2024年進行新的AI投資。其中,超過一半(59%)的受訪者明確稱,其所在公司正在加速對AI相關能力的新投資。其余受訪者稱正在評估AI領域的新投資,不過態(tài)度相對更謹慎。

從具體的方向看,多位業(yè)界專家在接受《每日經(jīng)濟新聞》記者采訪時認為,多模態(tài)模型與視頻生成能力、開源閉源之爭和AI智能體將最受關注,同時AI的安全性與監(jiān)管問題將繼續(xù)成為熱點話題。

狂飆突進的AI:全球AI獨角獸超470個,企業(yè)總價值達7.5萬億美元

2023年最令我吃驚的事情是,研究界的東西轉化為商業(yè)產(chǎn)品的速度太快了:Adobe的Firefly、百度的文心一言、谷歌的Bard、微軟的Copilot等等。我們正在探索這些東西的更多用處,而對終端用戶而言,這些工具可以協(xié)助完成機械性的任務、快速地綜合信息等,”馬里蘭大學計算機科學教授、微軟資深首席研究員哈爾·道梅三世(Hal Daumé III)對《每日經(jīng)濟新聞》記者表示。

《2023年AI現(xiàn)狀》報告數(shù)據(jù)顯示,截至2023年9月19日,全球AI獨角獸數(shù)量達473個,其中美國有315個,中國有70個,英國有27個,全球AI獨角獸企業(yè)的總價值達7.5萬億美元,其中美國AI獨角獸企業(yè)總價值達5.9萬億美元,中國AI獨角獸企業(yè)總價值為1.3萬億美元,英國AI獨角獸企業(yè)總價值為1550億美元。


圖片來源:《2023年AI現(xiàn)狀》報告截圖

2023年,OpenAI仍然保持著行業(yè)領頭羊和風向標的地位,3月發(fā)布多模態(tài)大模型GPT-4后,又將重心放在商業(yè)化嘗試和生態(tài)建設上,11月,OpenAI召開了第一次開發(fā)者大會,展露出打造生態(tài)的野心。

傳統(tǒng)的科技巨頭也各顯神通,試圖在這一風口領域拿下更多話語權。

圖片來源:每經(jīng)編輯 蘭素英制圖

微軟1月份就快速宣布將向OpenAI投資100億美元,希望進一步“拴緊”合作關系,同時也在加緊自家AI工具的發(fā)布和升級,陸續(xù)推出了AI賦能的Bing Chat,新的Edge瀏覽器,以及辦公軟件的Copilot套件。

谷歌在AI上頗有“起了個大早,趕了個晚集”的焦慮。2月,谷歌匆忙推出ChatGPT對手Bard,卻在演示過程中出現(xiàn)錯誤而導致股價一日大跌8%。為了加快速度,谷歌4月份將旗下兩個主要的人工智能研究部門GoogleBrain和DeepMind合并為Google DeepMind。12月,谷歌推出了GPT-4的對標大模型Gemini,并自稱在多個測試上性能優(yōu)于前者。

Facebook母公司Meta則重點強調自家大模型的開源特性。7月,Meta發(fā)布大語言模型Llama 2,宣布向所有開發(fā)和商用開源,與谷歌和OpenAI展開錯位競爭。在AI上聲量略小的亞馬遜,則重注押寶Anthropic,9月份宣布向后者投資40億美元。 

站在一線從業(yè)者的角度,Lightning AI的首席AI教育官塞巴斯蒂安·拉什卡(Sebastian Raschka)對《每日經(jīng)濟新聞》記者總結了2023年AI的發(fā)展,“2023年可以說是大語言模型之年,似乎所有人的注意力都在這上面。這一年,我們看到了各類提升大模型效率和適配性的方法;微調大模型方法和連接網(wǎng)絡內容的‘檢索增強生成技術;以Stable Video Diffusion和Pika 1.0為代表的文字生成視頻技術的熱潮等。”

生成式AI技術的發(fā)展不僅創(chuàng)造了新的機遇,也改變了各行各業(yè)的工作模式,以及企業(yè)為客戶提供價值的方式,提高了生產(chǎn)力。

2024年,AI發(fā)展將呈現(xiàn)三大趨勢

精彩紛呈的2023年被普遍視為生成式AI的元年,科技產(chǎn)業(yè)的圖景已經(jīng)被深刻改變。2024年,AI行業(yè)必將迎來巨大的變革。

12月25日,OpenAI CEO阿爾特曼向網(wǎng)友征集對OpenAI 2024年的期望,下一代多模態(tài)大模型GPT-5、更好的GPTs應用、視頻和開源等內容成為最常見的答案。實際上,多模態(tài)模型、視頻生成、AI智能體(Agents)也是業(yè)內人士展望2024年時的高頻詞。而隨著AI前所未有的發(fā)展態(tài)勢以及在各大領域的滲透,如何保障和監(jiān)管其可持續(xù)、負責任的發(fā)展也是接下來的重大課題之一。

趨勢一:視頻生成和智能體

2024年,我們會越來越依賴多模態(tài)模型,”艾倫人工智能研究院創(chuàng)始CEO奧倫·伊奇奧尼對《每日經(jīng)濟新聞》記者表示。

這也是《福布斯》所展望的2024年AI領域的發(fā)展趨勢之一。該雜志指出,AI領域一個關鍵性的創(chuàng)新是多模態(tài)生成式AI,此類系統(tǒng)能處理文本、聲音、旋律和視覺信號等各種輸入信息,并將其融合起來進行綜合理解。隨著多模態(tài)技術的不斷發(fā)展,AI模型將迎接更加復雜多樣化的交互場景,有望在智能家居、智慧城市、醫(yī)療診斷、自動駕駛等領域打開全新的應用空間。

視頻生成也是2024年值得關注的熱點。塞巴斯蒂安·拉什卡告訴記者,“Stable Video Diffusion和Pika 1.0這類文本生成視頻工具的發(fā)布意味著擴散模型又回來了。”

這類產(chǎn)品的“出圈”勢必會將加速視頻生成領域的迭代。除AI初創(chuàng)企業(yè)外,谷歌也在這一領域迅速跟進,先是與美國國家工程院院士、斯坦福大學教授李飛飛及其團隊合作推出AI視頻生成模型W.A.L.T,后又發(fā)布了一個全新的視頻生成模型VideoPoet,而且無需特定數(shù)據(jù)便可生成視頻。

雖然生成式AI沿著生成文字、圖像再到視頻不斷升級,但它與人類互動還停留在輸入和輸出內容的階段,而還無法真正幫人類在現(xiàn)實生活中做出行動,比如預定餐廳、購買物品等。

“2024年,我們將看到更加復雜的AI智能體,它們能代替用戶做出行動。”奧倫·伊奇奧尼對《每日經(jīng)濟新聞》記者預測道。

實際上, OpenAI在開發(fā)者大會上推出的定制GPTs和一系列輔助開發(fā)工具被視為打造AI智能體的先行部署。比爾·蓋茨11月也曾撰文指出,AI智能體將在未來五年里徹底改變我們使用計算機的方式。在他的暢想中,用戶只需用自然語言告知自己的需求,計算機就會自動跨越不同軟件程序完成任務,AI智能體將成為每個人都能擁有的“遠遠超出當今技術的AI驅動個人助理”。

趨勢二:開源或將超越專有模型

12月中旬,Meta 首席 AI 科學家、圖靈獎獲得者 Yann LeCun援引方舟投資研究團隊的一張2024年AI趨勢圖表感嘆稱,“開源人工智能模型正走在超越專有模型的路上。”

圖片來源:X.com

開源與專有模型的路線之爭頗有當年安卓與iOS的感覺。12月,Meta和IBM領頭成立了“AI聯(lián)盟”,成員包括40多家企業(yè)和學術機構,致力于推動發(fā)展AI的開放路線,在2023年風頭正勁的OpenAI、微軟、谷歌和英偉達則不在其中。

方舟投資(Ark Invest)的團隊認為,開源大模型在性能上落后閉源大模型6到8個月,但正在逐步縮小差距,隨著谷歌和OpenAI等公司越來越少地公布其模型的最新信息,開源大模型將對其商業(yè)模式構成挑戰(zhàn)。如上圖所示,開源模型的性能在不斷追趕專有模型。這可能意味著在不久的將來,開源模型有望在性能上與專有模型平起平坐,甚至超越。

不過,哈爾·道梅三世在采訪中對《每日經(jīng)濟新聞》記者表示,現(xiàn)在自稱開源的大模型只在限制性許可下公布了模型權重和代碼等內容,實際上離真正的開源還有距離。“我們需要的是開放的數(shù)據(jù)集、基礎設施和使用許可,我希望AI聯(lián)盟能往這個方向發(fā)展,但也并不是每家機構會認可這種做法。只要我們有很好的開放模型,人們可以自由選擇,剩下的就交給市場力量來發(fā)揮作用吧。”

以開源大模型結合內部數(shù)據(jù)打造定制化的AI應用,也是AI走向落地的重要方向之一。Meta 的開源大模型 LLaMA 系列就因其快速迭代、可定制性和隱私性的特點而備受青睞。在AI應用開發(fā)中結合內部數(shù)據(jù),可在很大程度上解決通用大模型產(chǎn)生的不準確或不合理回答的問題。

在科學研究領域,比如地球和大氣科學、天文學和高能物理學,我們有大量的數(shù)據(jù)。我認為在這些領域可能會有很多動作。此外,數(shù)據(jù)中間商也有收集和出售很多個人數(shù)據(jù),雖然我們可能不會看到這些數(shù)據(jù)被公開用來訓練模型,但可能將產(chǎn)生很多商業(yè)案例,其中會有好的應用,比如像英偉達那樣用聊天機器人來管理公司文件,也可能會有壞的應用,比如追蹤員工的郵件。”

趨勢三:AI監(jiān)管將加強

在AI技術高歌猛進的同時,科技圈也發(fā)生了一些戲劇性的事件:前有上千名科技大佬和AI專家聯(lián)名簽署公開信,呼吁暫停比GPT-4更強大的AI系統(tǒng)訓練之后,后有震驚業(yè)界的因安全和道德之爭而引發(fā)的OpenAI“宮斗”事件。

知名AI專家李飛飛表示,2023年是AI發(fā)展的“拐點”,這一年AI帶來了深刻改變,公眾對AI的認知度也上升了,但這一年“也顯示出這項技術有多么混亂”。

正如歷史上所有的顛覆性技術一樣,人類需要時間探索如何與AI相處。AI的安全性和監(jiān)管框架必將成為2024年的熱點話題。

斯坦福大學以人為本AI中心副主任詹姆斯·藍迪(James Landay)認為,由于AI視頻生成技術進一步提高,“我們將看到人們‘說’一些他們根本沒說過的話的視頻廣泛傳播,消費者需要認識到這一點,投票人也需要認識到這一點。”

尤為值得注意的是,2024年美國將舉行大選,如何應對生成式AI帶來的虛假信息沖擊,將是一個重要看點。

實際上,截至2023年底,我們已經(jīng)看到AI監(jiān)管有了不少行動。阿爾特曼重返OpenAI之后,第一個大動作就是發(fā)布最新安全指南,賦予董事會推翻公司領導層發(fā)布AI系統(tǒng)的否決權。12月,歐盟制定了《人工智能法案》,開始全面監(jiān)管AI。

“我想美國明年應該有比較大的監(jiān)管出臺,這一領域的監(jiān)管會越來越嚴,”曾參加拜登的AI業(yè)界面談的奧倫·伊奇奧尼對《每日經(jīng)濟新聞》記者表示。美國總統(tǒng)拜登曾召集各大科技公司首腦,讓行業(yè)承諾自發(fā)約束AI,后在10月又簽署了一份關于AI的總統(tǒng)行政令,但缺乏相關國會立法。

封面圖片來源:視覺中國-VCG111424718601

如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

Ai 生成式AI 大模型

歡迎關注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人 在线 免费