巖芯數(shù)智CEO劉凡平：讓每個(gè)設(shè)備都擁有個(gè)性化的智能

每日經(jīng)濟(jì)新聞 2024-07-09 23:22:16

每經(jīng)記者陳婷每經(jīng)編輯董興生

作為全球人工智能領(lǐng)域最具影響力的行業(yè)盛會(huì)之一，世界人工智能大會(huì)（以下簡稱WAIC）可以被視為觀察人工智能發(fā)展的一個(gè)窗口。WAIC 2024剛剛落幕，據(jù)《每日經(jīng)濟(jì)新聞》記者持續(xù)幾日在大會(huì)現(xiàn)場(chǎng)觀察，多模態(tài)已經(jīng)是當(dāng)之無愧的行業(yè)關(guān)鍵詞之一。

巖芯數(shù)智CEO劉凡平在接受《每日經(jīng)濟(jì)新聞》記者專訪時(shí)表示，就今年而言，大模型的多模態(tài)能力肯定比去年有所進(jìn)步。“但我認(rèn)為，整個(gè)行業(yè)肯定還要再進(jìn)步，目前我們已經(jīng)做到了多模態(tài)的輸入和輸出，距離完全像人一樣地實(shí)時(shí)人機(jī)交互，還要一點(diǎn)時(shí)間。”劉凡平表示，他有一個(gè)更高的目標(biāo)：在實(shí)現(xiàn)通用人工智能的同時(shí)，將AI與每個(gè)人獨(dú)特的地方結(jié)合在一起，模型具備自主學(xué)習(xí)能力，讓每個(gè)設(shè)備都擁有個(gè)性化的智能。

作為一家以認(rèn)知智能為基礎(chǔ)的創(chuàng)新企業(yè)，巖芯數(shù)智Rock AI在今年1月份發(fā)布了全國首個(gè)非Attention機(jī)制的Yan架構(gòu)通用大模型，開辟了非Transformer架構(gòu)的一條新路徑。這次WAIC，巖芯數(shù)智展示了Yan1.2版本的階段性成果，主要展示Yan架構(gòu)在更廣泛、更低算力設(shè)備上的離線部署及多模態(tài)應(yīng)用能力。

巖芯數(shù)智之外，據(jù)記者了解，今年WAIC期間，不少從業(yè)者強(qiáng)調(diào)了多模態(tài)的重要性。階躍星辰創(chuàng)始人、CEO姜大昕博士表示：“攀登AGI山峰，‘萬億參數(shù)’和‘多模融合’缺一不可。”MiniMax副總裁劉華認(rèn)為，多模態(tài)大模型有望引領(lǐng)新一輪科技革命。

除了熱度居高不下的多模態(tài)，今年WAIC，對(duì)于大模型應(yīng)用落地的討論更多元了，對(duì)于安全治理的見解也更深入了。

大模型“百花齊放”

官方資料顯示，今年WAIC大會(huì)展覽面積超5.2萬平方米，500余家知名企業(yè)、超1500項(xiàng)展品參展，50余款新品首發(fā)首秀，均達(dá)歷史最高。此外，近百個(gè)大模型集中展現(xiàn)，18臺(tái)人形機(jī)器人矩陣亮相，國內(nèi)首款全尺寸通用人形機(jī)器人開源公版機(jī)發(fā)布。

“目前來看，具身智能是挺多的。”劉凡平表示，就當(dāng)前來看，具身智能的大腦可能還不夠成熟，“未來，具身智能大腦仍需持續(xù)突破”。

大會(huì)現(xiàn)場(chǎng)，巖芯數(shù)智的研發(fā)團(tuán)隊(duì)展示了一款部署Yan1.2多模態(tài)大模型的智能機(jī)器人小智，它基于Yan1.2的語音和視覺處理能力，能實(shí)時(shí)識(shí)別環(huán)境、準(zhǔn)確理解用戶的模糊指令和意圖，并據(jù)此控制其機(jī)械軀體高效完成各類復(fù)雜任務(wù)。

據(jù)記者了解，小智機(jī)器人搭載的核心硬件是以低算力著稱的樹莓派第五代芯片，可在極低算力的設(shè)備上實(shí)現(xiàn)多模態(tài)能力。

現(xiàn)場(chǎng)，巖芯數(shù)智的工作人員向記者介紹了小智的能力。面對(duì)記者，它不但能依據(jù)指令向記者鞠躬，還能描述出記者身上穿的衣物特征。此外，小智還有文字類圖像的理解能力?，F(xiàn)場(chǎng)，工作人員在小智面前展示了書本的一頁內(nèi)容，很快，小智就能總結(jié)、復(fù)述出書本文字的大致意思。

劉凡平用“百花齊放”形容今年的WAIC。他表示：“當(dāng)大模型真正發(fā)展落地的時(shí)候，其實(shí)不能再用以前的思維和大眾思維思考這個(gè)問題，還是要以未來的視角去思考現(xiàn)在如何演進(jìn)。”

據(jù)記者了解，今年WAIC，創(chuàng)業(yè)公司和大廠各有千秋。

阿里巴巴推出“通義十二時(shí)辰”，展示了對(duì)話、效率、智能體、視覺四個(gè)核心場(chǎng)景中的AI助手能力。此外，快手再次升級(jí)視頻生成大模型“可靈”，騰訊則攜混元大模型及多款A(yù)I應(yīng)用亮相。

與此同時(shí)，記者了解到，大會(huì)期間，創(chuàng)業(yè)公司階躍星辰首發(fā)了三款Step系列通用大模型新品：Step-2萬億參數(shù)語言大模型正式版、Step-1.5V多模態(tài)大模型、Step-1X圖像生成大模型。

此外，據(jù)MiniMax副總裁劉華介紹，MiniMax將海螺AI、星野和MiniMax開放平臺(tái)帶到了本次世界人工智能大會(huì)。海螺AI可為用戶分析財(cái)報(bào)、速讀長文、創(chuàng)作文案，聆聽用戶的想法和煩惱，捕捉、理解用戶情緒。

據(jù)悉，海螺AI背后接入了MiniMax自研的多模態(tài)大模型，包括萬億參數(shù)MoE大語言模型abab6.5、語音大模型和圖像大模型。

關(guān)鍵在自主學(xué)習(xí)能力

在本屆WAIC期間，還出現(xiàn)了不少探討AI未來發(fā)展方向的聲音。劉凡平便有一個(gè)更高的目標(biāo)：就是在實(shí)現(xiàn)通用人工智能的同時(shí)，將AI與每個(gè)人獨(dú)特的地方結(jié)合在一起，模型具備自主學(xué)習(xí)能力，讓每個(gè)設(shè)備都擁有個(gè)性化的智能。

“我覺得驚艷的突破，不在于模型本身已有的知識(shí)能力。”劉凡平表示。雖說大家現(xiàn)在都在比參數(shù)量，但在他看來，更需要比較的是大模型自主學(xué)習(xí)的能力有多強(qiáng)。

“舉個(gè)例子，小蒼蠅、小壁虎、小兔子，它們的腦容量是不一樣的，但它們都具備智能。”劉凡平認(rèn)為，智能和參數(shù)量沒有直接相關(guān)的關(guān)系，“我認(rèn)為大模型之后的比較方向應(yīng)該是自主學(xué)習(xí)能力”。

劉凡平表示，當(dāng)大模型具備了自主學(xué)習(xí)的智能，才是通用人工智能真正的開始，“現(xiàn)有的并不是（自主學(xué)習(xí)），現(xiàn)有的是一種壓縮算法”。

對(duì)于大模型的未來，MiniMax副總裁劉華也表達(dá)了看法。他認(rèn)為，隨著多模態(tài)大模型技術(shù)的持續(xù)演進(jìn)，文本、語音、視覺這三種模態(tài)的融合模型正逐步邁向成熟。一旦此類大模型技術(shù)達(dá)到成熟階段，其應(yīng)用場(chǎng)景將會(huì)進(jìn)一步拓展，實(shí)現(xiàn)更多的實(shí)際應(yīng)用。

劉華認(rèn)為，在短期內(nèi)，對(duì)多模態(tài)大模型的大規(guī)模落地應(yīng)用預(yù)期應(yīng)保持審慎態(tài)度，不過從中長期來看，堅(jiān)決不應(yīng)低估多模態(tài)大模型的重要性，它有望引領(lǐng)新一輪的科技革命。

另據(jù)媒體報(bào)道，曠視科技聯(lián)合創(chuàng)始人、CTO唐文斌接受采訪時(shí)表示，相比語言模型，增加訓(xùn)練數(shù)據(jù)量和參數(shù)量對(duì)于計(jì)算機(jī)視覺模型的提升和收益，目前看并沒有那么大，而多模態(tài)會(huì)是大模型的未來。騰訊集團(tuán)副總裁蔣杰也表示，大模型行業(yè)正經(jīng)歷從單模態(tài)到多模態(tài)，再到全模態(tài)的演進(jìn)。

劉凡平也注意到了大模型在多模態(tài)能力上的進(jìn)步，他表示，與去年相比，今年WAIC在智能化也有所提升，但基礎(chǔ)變化還不是很大，硬件層次則更難。他推斷，未來人工智能一定會(huì)走向硬件化，“當(dāng)已經(jīng)完全硬件化的時(shí)候，就是完全可商用的時(shí)候，任何人都可以用得起”。

他認(rèn)為，今后大家可能會(huì)選用一種全新的算法替代現(xiàn)有的Transformer架構(gòu)。Transformer架構(gòu)依賴的算力非常大，同時(shí)數(shù)據(jù)量要求非常高，這兩個(gè)條件限制了它的發(fā)展。

記者發(fā)現(xiàn)，雖然大多選擇從B端出發(fā)，但很多大模型公司已有面向C端的動(dòng)作。

以階躍星辰為例，其在WAIC現(xiàn)場(chǎng)展示了面向C端用戶的自研產(chǎn)品。據(jù)報(bào)道，階躍星辰副總裁李璟在接受媒體采訪時(shí)表示，目前，C端仍在早期階段，還在進(jìn)行用戶體驗(yàn)的收集和打磨，隨著C端模型能力提升，將產(chǎn)生很強(qiáng)的爆發(fā)力。而B端需求相對(duì)明確和穩(wěn)定，已經(jīng)涌現(xiàn)出非常多的確定性應(yīng)用機(jī)會(huì)。劉華也表示，MiniMax堅(jiān)持To B與To C業(yè)務(wù)并重的發(fā)展策略。

此外，記者從巖芯數(shù)智了解到，公司當(dāng)前商業(yè)化的重心正逐漸從B端部署到C端，以軟硬件結(jié)合的方式搶占C端市場(chǎng)先機(jī)。

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

模型大模型 CEO

上一篇文章

投建小米汽車2S店重慶百貨汽貿(mào)業(yè)務(wù)借勢(shì)突圍？

返回每經(jīng)網(wǎng)首頁

下一篇文章

中國西電：下屬12家子公司中標(biāo)國家電網(wǎng)采購項(xiàng)

相關(guān)文章