每日經(jīng)濟新聞 2023-11-06 21:01:46
◎下半年,國內(nèi)大模型創(chuàng)業(yè)公司也進入了產(chǎn)品的密集發(fā)布和融資關(guān)鍵期。不過,現(xiàn)階段大模型企業(yè)要脫穎而出,應(yīng)該在用戶口碑中拔得頭籌,大模型企業(yè)要搶占先機,推出應(yīng)用要快,要早。
每經(jīng)記者 趙雯琪 每經(jīng)編輯 劉雪梅
距離宣布親自下場大模型創(chuàng)業(yè)“不僅僅要做中文ChatGPT”僅僅8個月,李開復(fù)和他的AI公司迎來實質(zhì)性進展。
11月6日,李開復(fù)帶隊創(chuàng)辦的AI 2.0公司零一萬物正式開源發(fā)布首款預(yù)訓(xùn)練大模型Yi-34B,同時宣布啟動下一個千億參數(shù)模型的訓(xùn)練。目前該AI大模型已開放商用申請,并在阿里云魔搭社區(qū)ModelScope首發(fā)。
《每日經(jīng)濟新聞》記者同時獲悉,零一萬物已完成由阿里云領(lǐng)投的10億美元融資。目前,零一萬物估值已超10億美元,躋身獨角獸行列。這也就意味著,創(chuàng)業(yè)8個月,李開復(fù)再收獲一家AI獨角獸公司。
今年以來,生成式AI成為資本市場最大的熱點和風(fēng)口。國內(nèi)大模型創(chuàng)業(yè)賽道中涌現(xiàn)出上百家創(chuàng)業(yè)公司,多個科技大廠也親自下場。如今隨著越來越多頭部企業(yè)發(fā)布產(chǎn)品并陸續(xù)獲得融資,國內(nèi)大模型激戰(zhàn)也進入新的階段。
浙江大學(xué)國際聯(lián)合商學(xué)院數(shù)字經(jīng)濟與金融創(chuàng)新研究中心聯(lián)席主任、研究員盤和林在接受《每日經(jīng)濟新聞》記者采訪時表示,大模型如今正呈現(xiàn)百舸爭流、千帆競渡的景象,實質(zhì)上大模型的基礎(chǔ)算法并不難,難的是通過數(shù)據(jù)學(xué)習(xí)和參數(shù)積累形成一個通用人工智能,并被用戶廣泛認(rèn)可,現(xiàn)階段大模型企業(yè)要脫穎而出,應(yīng)該在用戶口碑中拔得頭籌,大模型企業(yè)要搶占先機,推出應(yīng)用要快,要早。
據(jù)零一萬物介紹,此次開源發(fā)布的Yi系列模型,包含34B和6B兩個版本。在Hugging Face英文測試公開榜單Pretrained預(yù)訓(xùn)練開源模型排名中,Yi-34B各項性能以70.72的分?jǐn)?shù)位列全球第一,公開資料顯示,Hugging Face是全球最受歡迎的大模型、數(shù)據(jù)集開源社區(qū),被認(rèn)為是大模型領(lǐng)域的GitHub,在大模型英文能力測試中具有相當(dāng)權(quán)威性。
值得一提的是,作為國產(chǎn)大模型,Yi-34B更“懂”中文。對比大模型標(biāo)桿GPT-4,在CMMLU、E-Eval、Gaokao三個主要的中文指標(biāo)上,Yi-34B也具有優(yōu)勢,能更好地滿足國內(nèi)市場需求。
各評測集得分:Yi模型v.s.其他開源模型 圖片來源:零一萬物
《每日經(jīng)濟新聞》記者從零一萬物了解到,此次開源的Yi-34B模型,將發(fā)布全球最長、可支持200K超長上下文窗口(context window)版本,可以處理約40萬漢字超長文本輸入。相比之下,OpenAI的GPT-4上下文窗口只有32K,文字處理量約2.5萬字。
據(jù)了解,在語言模型中,上下文窗口是大模型綜合運算能力的金指標(biāo)之一,對于理解和生成與特定上下文相關(guān)的文本至關(guān)重要,擁有更長窗口的語言模型可以處理更豐富的知識庫信息,生成更連貫、準(zhǔn)確的文本。
此外,在文檔摘要、基于文檔的問答等下游任務(wù)中,長上下文的能力發(fā)揮著關(guān)鍵作用,行業(yè)應(yīng)用場景廣闊。在法律、財務(wù)、傳媒、檔案整理等諸多垂直場景里,更準(zhǔn)確、更連貫、速度更快的長文本窗口功能,可以成為人們更可靠的AI助理,讓生產(chǎn)力提升。
然而,受限于計算復(fù)雜度、數(shù)據(jù)完備度等問題,上下文窗口規(guī)模擴充從計算、內(nèi)存和通信的角度存在各種挑戰(zhàn),因此大多數(shù)發(fā)布的大型語言模型僅支持幾千tokens的上下文長度。為了解決這個限制,零一萬物技術(shù)團隊實施了一系列優(yōu)化,包括:計算通信重疊、序列并行、通信壓縮等。通過這些能力增強,實現(xiàn)了在大規(guī)模模型訓(xùn)練中近100倍的能力提升,也為Yi系列模型上下文規(guī)模下一次躍升儲備了充足“電力”。
李開復(fù)表示,零一萬物堅定進軍全球第一梯隊目標(biāo),從招的第一個人,寫的第一行代碼,設(shè)計的第一個模型開始,就一直抱著成為‘World's No.1’(世界第一)的初衷和決心。
“我們組成了一支有潛力對標(biāo)OpenAI、Google等一線大廠的團隊,經(jīng)歷了近半年的厚積薄發(fā),以穩(wěn)定的節(jié)奏和全球齊平的研究工程能力,交出了第一張極具全球競爭力的耀眼成績單。Yi-34B可以說不負眾望,一鳴驚人。”李開復(fù)表示。
創(chuàng)業(yè)8個月,如今隨著首款大模型的發(fā)布,大模型賽道再添新的競爭力。
《每日經(jīng)濟新聞》記者在零一萬物官網(wǎng)發(fā)現(xiàn),零一萬物預(yù)測,AI 2.0時代將誕生比移動互聯(lián)網(wǎng)大十倍的平臺機會,將把既有的軟件、使用界面和應(yīng)用重寫一次,改寫用戶的交互和入口。AI 2.0時代將誕生新一批AI-first(AI為先)的應(yīng)用,催生以AI為內(nèi)核的應(yīng)用生態(tài),催生未來的超級App及嶄新的商業(yè)模式。
這或許也是李開復(fù)親自下場加入AI大模型創(chuàng)業(yè)并以最快速度推出首款產(chǎn)品的主要原因。
今年以來,大模型賽道吸引了包括阿里、百度、字節(jié)跳動等頭部大廠和李開復(fù)、王慧文、王小川等科技大佬的關(guān)注,圍繞大模型的創(chuàng)業(yè)和競爭異常激烈。根據(jù)創(chuàng)業(yè)邦研究中心發(fā)布的《2023年H1 AIGC產(chǎn)業(yè)報告》,2023年上半年,國內(nèi)AIGC領(lǐng)域的融資事件共57起,已披露融資總額63.13億元,涉及投資機構(gòu)數(shù)66家。
到了下半年,國內(nèi)大模型創(chuàng)業(yè)公司也進入了產(chǎn)品的密集發(fā)布和融資關(guān)鍵期。公開數(shù)據(jù)顯示,截至2023年8月,我國已發(fā)布的大模型已經(jīng)達到156個,10億級參數(shù)規(guī)模以上大模型超80個,“百模大戰(zhàn)”蓄勢待發(fā)。
不過,在大模型創(chuàng)業(yè)浪潮下,很多業(yè)內(nèi)人士不免擔(dān)心行業(yè)泡沫的問題,大模型創(chuàng)業(yè)公司瀾舟科技創(chuàng)始人兼CEO周明在接受媒體采訪時公開表示,中國對新技術(shù)的追求和自驅(qū)能力較強,但是行業(yè)需要注意泡沫問題。“花很大的功夫訓(xùn)練一個不好不賴的模型,對廠商自己是一個學(xué)習(xí)鍛煉的過程,但對社會可能不一定有用。哪怕創(chuàng)業(yè),可能白白浪費了很多創(chuàng)業(yè)資本和投入。”周明說。
盤和林則認(rèn)為,當(dāng)前國內(nèi)AI大模型,雖然很多,但能夠被用戶認(rèn)可的大模型還不多,很多大模型僅僅在測試中能夠?qū)?biāo)ChatGPT等國外產(chǎn)品,且當(dāng)前國內(nèi)的大模型發(fā)展也受制于算力。
“我認(rèn)為現(xiàn)階段大模型企業(yè)要脫穎而出,應(yīng)該在用戶口碑中拔得頭籌,這個用戶口碑的關(guān)鍵還是C端用戶,對用戶來說,好玩和有用的東西才能廣泛傳播,而一旦某個大模型用戶培養(yǎng)了使用習(xí)慣,則此大模型將成為一種新的互聯(lián)網(wǎng)生態(tài)產(chǎn)品,繼而獲得馬太效應(yīng),所以,大模型企業(yè)要搶占先機,推出應(yīng)用要快,要早。”盤和林表示。
封面圖片來源:每經(jīng)記者 趙雯琪 攝
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP