每日經(jīng)濟新聞 2024-07-09 23:22:16
每經(jīng)記者 陳婷 每經(jīng)編輯 董興生
作為全球人工智能領(lǐng)域最具影響力的行業(yè)盛會之一,世界人工智能大會(以下簡稱WAIC)可以被視為觀察人工智能發(fā)展的一個窗口。WAIC 2024剛剛落幕,據(jù)《每日經(jīng)濟新聞》記者持續(xù)幾日在大會現(xiàn)場觀察,多模態(tài)已經(jīng)是當(dāng)之無愧的行業(yè)關(guān)鍵詞之一。
巖芯數(shù)智CEO劉凡平在接受《每日經(jīng)濟新聞》記者專訪時表示,就今年而言,大模型的多模態(tài)能力肯定比去年有所進步。“但我認為,整個行業(yè)肯定還要再進步,目前我們已經(jīng)做到了多模態(tài)的輸入和輸出,距離完全像人一樣地實時人機交互,還要一點時間。”劉凡平表示,他有一個更高的目標(biāo):在實現(xiàn)通用人工智能的同時,將AI與每個人獨特的地方結(jié)合在一起,模型具備自主學(xué)習(xí)能力,讓每個設(shè)備都擁有個性化的智能。
作為一家以認知智能為基礎(chǔ)的創(chuàng)新企業(yè),巖芯數(shù)智Rock AI在今年1月份發(fā)布了全國首個非Attention機制的Yan架構(gòu)通用大模型,開辟了非Transformer架構(gòu)的一條新路徑。這次WAIC,巖芯數(shù)智展示了Yan1.2版本的階段性成果,主要展示Yan架構(gòu)在更廣泛、更低算力設(shè)備上的離線部署及多模態(tài)應(yīng)用能力。
巖芯數(shù)智之外,據(jù)記者了解,今年WAIC期間,不少從業(yè)者強調(diào)了多模態(tài)的重要性。階躍星辰創(chuàng)始人、CEO姜大昕博士表示:“攀登AGI山峰,‘萬億參數(shù)’和‘多模融合’缺一不可。”MiniMax副總裁劉華認為,多模態(tài)大模型有望引領(lǐng)新一輪科技革命。
除了熱度居高不下的多模態(tài),今年WAIC,對于大模型應(yīng)用落地的討論更多元了,對于安全治理的見解也更深入了。
大模型“百花齊放”
官方資料顯示,今年WAIC大會展覽面積超5.2萬平方米,500余家知名企業(yè)、超1500項展品參展,50余款新品首發(fā)首秀,均達歷史最高。此外,近百個大模型集中展現(xiàn),18臺人形機器人矩陣亮相,國內(nèi)首款全尺寸通用人形機器人開源公版機發(fā)布。
“目前來看,具身智能是挺多的。”劉凡平表示,就當(dāng)前來看,具身智能的大腦可能還不夠成熟,“未來,具身智能大腦仍需持續(xù)突破”。
大會現(xiàn)場,巖芯數(shù)智的研發(fā)團隊展示了一款部署Yan1.2多模態(tài)大模型的智能機器人小智,它基于Yan1.2的語音和視覺處理能力,能實時識別環(huán)境、準(zhǔn)確理解用戶的模糊指令和意圖,并據(jù)此控制其機械軀體高效完成各類復(fù)雜任務(wù)。
據(jù)記者了解,小智機器人搭載的核心硬件是以低算力著稱的樹莓派第五代芯片,可在極低算力的設(shè)備上實現(xiàn)多模態(tài)能力。
現(xiàn)場,巖芯數(shù)智的工作人員向記者介紹了小智的能力。面對記者,它不但能依據(jù)指令向記者鞠躬,還能描述出記者身上穿的衣物特征。此外,小智還有文字類圖像的理解能力?,F(xiàn)場,工作人員在小智面前展示了書本的一頁內(nèi)容,很快,小智就能總結(jié)、復(fù)述出書本文字的大致意思。
劉凡平用“百花齊放”形容今年的WAIC。他表示:“當(dāng)大模型真正發(fā)展落地的時候,其實不能再用以前的思維和大眾思維思考這個問題,還是要以未來的視角去思考現(xiàn)在如何演進。”
據(jù)記者了解,今年WAIC,創(chuàng)業(yè)公司和大廠各有千秋。
阿里巴巴推出“通義十二時辰”,展示了對話、效率、智能體、視覺四個核心場景中的AI助手能力。此外,快手再次升級視頻生成大模型“可靈”,騰訊則攜混元大模型及多款A(yù)I應(yīng)用亮相。
與此同時,記者了解到,大會期間,創(chuàng)業(yè)公司階躍星辰首發(fā)了三款Step系列通用大模型新品:Step-2萬億參數(shù)語言大模型正式版、Step-1.5V多模態(tài)大模型、Step-1X圖像生成大模型。
此外,據(jù)MiniMax副總裁劉華介紹,MiniMax將海螺AI、星野和MiniMax開放平臺帶到了本次世界人工智能大會。海螺AI可為用戶分析財報、速讀長文、創(chuàng)作文案,聆聽用戶的想法和煩惱,捕捉、理解用戶情緒。
據(jù)悉,海螺AI背后接入了MiniMax自研的多模態(tài)大模型,包括萬億參數(shù)MoE大語言模型abab6.5、語音大模型和圖像大模型。
關(guān)鍵在自主學(xué)習(xí)能力
在本屆WAIC期間,還出現(xiàn)了不少探討AI未來發(fā)展方向的聲音。劉凡平便有一個更高的目標(biāo):就是在實現(xiàn)通用人工智能的同時,將AI與每個人獨特的地方結(jié)合在一起,模型具備自主學(xué)習(xí)能力,讓每個設(shè)備都擁有個性化的智能。
“我覺得驚艷的突破,不在于模型本身已有的知識能力。”劉凡平表示。雖說大家現(xiàn)在都在比參數(shù)量,但在他看來,更需要比較的是大模型自主學(xué)習(xí)的能力有多強。
“舉個例子,小蒼蠅、小壁虎、小兔子,它們的腦容量是不一樣的,但它們都具備智能。”劉凡平認為,智能和參數(shù)量沒有直接相關(guān)的關(guān)系,“我認為大模型之后的比較方向應(yīng)該是自主學(xué)習(xí)能力”。
劉凡平表示,當(dāng)大模型具備了自主學(xué)習(xí)的智能,才是通用人工智能真正的開始,“現(xiàn)有的并不是(自主學(xué)習(xí)),現(xiàn)有的是一種壓縮算法”。
對于大模型的未來,MiniMax副總裁劉華也表達了看法。他認為,隨著多模態(tài)大模型技術(shù)的持續(xù)演進,文本、語音、視覺這三種模態(tài)的融合模型正逐步邁向成熟。一旦此類大模型技術(shù)達到成熟階段,其應(yīng)用場景將會進一步拓展,實現(xiàn)更多的實際應(yīng)用。
劉華認為,在短期內(nèi),對多模態(tài)大模型的大規(guī)模落地應(yīng)用預(yù)期應(yīng)保持審慎態(tài)度,不過從中長期來看,堅決不應(yīng)低估多模態(tài)大模型的重要性,它有望引領(lǐng)新一輪的科技革命。
另據(jù)媒體報道,曠視科技聯(lián)合創(chuàng)始人、CTO唐文斌接受采訪時表示,相比語言模型,增加訓(xùn)練數(shù)據(jù)量和參數(shù)量對于計算機視覺模型的提升和收益,目前看并沒有那么大,而多模態(tài)會是大模型的未來。騰訊集團副總裁蔣杰也表示,大模型行業(yè)正經(jīng)歷從單模態(tài)到多模態(tài),再到全模態(tài)的演進。
劉凡平也注意到了大模型在多模態(tài)能力上的進步,他表示,與去年相比,今年WAIC在智能化也有所提升,但基礎(chǔ)變化還不是很大,硬件層次則更難。他推斷,未來人工智能一定會走向硬件化,“當(dāng)已經(jīng)完全硬件化的時候,就是完全可商用的時候,任何人都可以用得起”。
他認為,今后大家可能會選用一種全新的算法替代現(xiàn)有的Transformer架構(gòu)。Transformer架構(gòu)依賴的算力非常大,同時數(shù)據(jù)量要求非常高,這兩個條件限制了它的發(fā)展。
記者發(fā)現(xiàn),雖然大多選擇從B端出發(fā),但很多大模型公司已有面向C端的動作。
以階躍星辰為例,其在WAIC現(xiàn)場展示了面向C端用戶的自研產(chǎn)品。據(jù)報道,階躍星辰副總裁李璟在接受媒體采訪時表示,目前,C端仍在早期階段,還在進行用戶體驗的收集和打磨,隨著C端模型能力提升,將產(chǎn)生很強的爆發(fā)力。而B端需求相對明確和穩(wěn)定,已經(jīng)涌現(xiàn)出非常多的確定性應(yīng)用機會。劉華也表示,MiniMax堅持To B與To C業(yè)務(wù)并重的發(fā)展策略。
此外,記者從巖芯數(shù)智了解到,公司當(dāng)前商業(yè)化的重心正逐漸從B端部署到C端,以軟硬件結(jié)合的方式搶占C端市場先機。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP