每日經(jīng)濟(jì)新聞 2024-10-17 21:38:20
每經(jīng)記者 趙雯琪 每經(jīng)編輯 楊 夏
發(fā)布千億參數(shù)模型YiLarge 5個(gè)月后,零一萬(wàn)物創(chuàng)始人兼CEO李開復(fù)再次帶著新產(chǎn)品公開亮相。
10月16日,零一萬(wàn)物正式發(fā)布新的預(yù)訓(xùn)練模型Yi-Lightning(直譯為閃電模型)。選擇在此時(shí)發(fā)布新產(chǎn)品,或許是為了用實(shí)際行動(dòng)回應(yīng)市場(chǎng)猜測(cè)。前段時(shí)間,國(guó)內(nèi)大模型創(chuàng)業(yè)公司“六小虎”(智譜AI、百川智能、零一萬(wàn)物、月之暗面、Minimax、階躍星辰)均受到不同程度的質(zhì)疑,零一萬(wàn)物更是被直指放棄了預(yù)訓(xùn)練。
視覺中國(guó)
對(duì)此,零一萬(wàn)物創(chuàng)始人兼CEO李開復(fù)在新品發(fā)布后接受包括每日經(jīng)濟(jì)新聞在內(nèi)的媒體采訪時(shí)表示,零一萬(wàn)物絕不會(huì)放棄預(yù)訓(xùn)練模型工作。值得一提的是,在To B(面向企業(yè)端)戰(zhàn)略下,零一萬(wàn)物首次發(fā)布了針對(duì)零售和電商等場(chǎng)景的行業(yè)應(yīng)用產(chǎn)品AI 2.0數(shù)字人,并已在彈幕互動(dòng)、商品信息提取、實(shí)時(shí)話術(shù)生成等環(huán)節(jié)接入了Yi-Lightning。
進(jìn)入2024年,中國(guó)大模型行業(yè)從狂奔進(jìn)入到了“長(zhǎng)跑階段”。從技術(shù)側(cè)和產(chǎn)業(yè)側(cè)都引發(fā)了行業(yè)的進(jìn)一步思考,頭部企業(yè)開始探索更多商業(yè)化方向。今年8月,月之暗面創(chuàng)始人楊植麟開始將一部分精力放到B端業(yè)務(wù)上,他們正式發(fā)布了Kimi企業(yè)級(jí)API,以探索在B端的商業(yè)模式。百川智能則與國(guó)家兒童醫(yī)學(xué)中心北京兒童醫(yī)院簽署戰(zhàn)略合作協(xié)議,雙方計(jì)劃共同推出“一大四小”五款A(yù)I醫(yī)療產(chǎn)品。
李開復(fù)表示,中國(guó)大模型產(chǎn)業(yè)進(jìn)入到了“耐力賽”階段,如何讓大模型賦能千行百業(yè),提升企業(yè)新質(zhì)生產(chǎn)力是一個(gè)重要的命題。這不僅將牽涉到“大模型+行業(yè)”的未來(lái)發(fā)展方向,甚至?xí)绊懯澜绲膭?chuàng)新版圖。
預(yù)訓(xùn)練一次數(shù)百萬(wàn)美元
據(jù)李開復(fù)分享,在LMSYS盲測(cè)競(jìng)技場(chǎng)總榜(用戶對(duì)一組大模型回答進(jìn)行盲投的榜單)上,零一萬(wàn)物最新發(fā)布的Yi-Lightning位列第六,僅次于OpenAI的GPT-4o、o1系列,以及Google的Gemini 1.5 pro系列,與馬斯克xAI旗下Grok-2打平。這是中國(guó)大模型廠商目前在該榜單上取得的最好成績(jī)。
此外,閃電模型的發(fā)布,也是李開復(fù)對(duì)于“零一萬(wàn)物放棄預(yù)訓(xùn)練”市場(chǎng)傳言的回?fù)簟?/p>
他表示,GPT新發(fā)布o(jì)1之后,給零一萬(wàn)物團(tuán)隊(duì)帶來(lái)了新靈感,“一年半以前大家覺得大模型最厲害的地方就是預(yù)訓(xùn)練,一年以后發(fā)現(xiàn)Post train(后訓(xùn)練)也是同樣重要的,感謝OpenAI點(diǎn)醒我們這一點(diǎn)。”不過(guò),李開復(fù)提到,后訓(xùn)練的重要性變高,不代表要徹底放棄預(yù)訓(xùn)練。
根據(jù)公開信息,大模型預(yù)訓(xùn)練是在大規(guī)模數(shù)據(jù)集上進(jìn)行的初步訓(xùn)練,旨在讓模型學(xué)習(xí)通用的語(yǔ)言知識(shí)和模式。而后訓(xùn)練則是在預(yù)訓(xùn)練的基礎(chǔ)上,針對(duì)特定任務(wù)進(jìn)行的進(jìn)一步優(yōu)化和調(diào)整,以使模型在該任務(wù)上表現(xiàn)得更加出色。
李開復(fù)表示,他認(rèn)為做好預(yù)訓(xùn)練模型是一個(gè)技術(shù)活,而且是要非常多有才華的人在一起工作,慢工出細(xì)活,需要有懂芯片的人,懂推理的人,懂基礎(chǔ)架構(gòu)的人,懂模型的人,一起做出來(lái)。不過(guò)他也坦言,不是每家公司都可以做這件事情,因?yàn)槌杀颈容^高,以后做預(yù)訓(xùn)練的大模型公司可能會(huì)越來(lái)越少。但他明確表態(tài),零一萬(wàn)物絕不放棄預(yù)訓(xùn)練。
《每日經(jīng)濟(jì)新聞》記者也發(fā)現(xiàn),今年以來(lái),有一批大模型公司停下了研發(fā)的腳步。據(jù)經(jīng)濟(jì)觀察網(wǎng)統(tǒng)計(jì),截至2024年10月9日,在188個(gè)通過(guò)網(wǎng)信辦生成式人工智能備案的大模型中,超過(guò)三成的大模型在通過(guò)備案后未進(jìn)一步公開進(jìn)展情況,僅有約一成的大模型仍在加速訓(xùn)練,接近一半的大模型轉(zhuǎn)向了AI應(yīng)用的開發(fā)。
據(jù)李開復(fù)透露,做預(yù)訓(xùn)練的Production Run(投產(chǎn)運(yùn)行)的訓(xùn)練成本是一次三四百萬(wàn)美元。“‘六小虎’的融資額度都是夠的,這個(gè)錢頭部公司都付得起。我覺得中國(guó)的六家大模型公司只要有夠好的人才,如果有想做預(yù)訓(xùn)練的決心,資金和芯片算力都不是問題。”李開復(fù)表示。
探索To B商業(yè)空間
值得一提的是,創(chuàng)業(yè)一年,李開復(fù)帶領(lǐng)零一萬(wàn)物開始加速探索商業(yè)化落地和更多賺錢的機(jī)會(huì)。
曾公開宣布不打“價(jià)格戰(zhàn)”的李開復(fù)將Yi-Lightning定價(jià)在0.99元/百萬(wàn)tokens。對(duì)此,李開復(fù)表示,這并不是一個(gè)虧本的價(jià)格,公司仍有相對(duì)理想的利潤(rùn)空間。除此之外,零一萬(wàn)物也首次對(duì)外發(fā)布其To B戰(zhàn)略下的首發(fā)行業(yè)應(yīng)用產(chǎn)品AI 2.0數(shù)字人,聚焦零售和電商等場(chǎng)景,將最新版旗艦?zāi)P蚘i-Lightning實(shí)踐于具體行業(yè)解決方案。
據(jù)零一萬(wàn)物透露,目前零一萬(wàn)物數(shù)字人的合作案例包括全國(guó)某著名餐飲連鎖、某頭部酒旅類客戶、全國(guó)某知名水果連鎖店等,均取得了顯著的GMV(商品交易總額)提升。其中,某頭部酒旅企業(yè)在接入Yi-Lightning全新加持的數(shù)字人直播后,GMV較此前上升170%。
除直播外,零一萬(wàn)物也為數(shù)字人客戶準(zhǔn)備了AI 2.0門店短視頻解決方案??蛻艨赏ㄟ^(guò)極簡(jiǎn)流程,隨時(shí)生成超低成本的高品質(zhì)營(yíng)銷視頻,解決了傳統(tǒng)真人短視頻的成本和制作周期問題。短視頻與直播內(nèi)容相互配合,為商品提供持續(xù)曝光,提升轉(zhuǎn)化率。
這也意味著,在通用大模型產(chǎn)品迭代之外,零一萬(wàn)物也在探索更多的商業(yè)化落地方向?!睹咳战?jīng)濟(jì)新聞》記者了解到,零一萬(wàn)物今年下半年開始在To B解決方案上加速布局,6月份以來(lái),零一萬(wàn)物相繼宣布與阿里云、360、順豐科技、飛書、釘釘、鈦動(dòng)科技等頭部企業(yè)達(dá)成合作。
實(shí)際上,不僅是零一萬(wàn)物,經(jīng)過(guò)一年多的“百模大戰(zhàn)”,大部分大模型公司都從技術(shù)浪漫走到落地求生階段?!睹咳战?jīng)濟(jì)新聞》記者根據(jù)公開信息發(fā)現(xiàn),今年以來(lái),月之暗面、百川智能、智譜AI等大模型公司都在探索商業(yè)化和B端運(yùn)用場(chǎng)景。
李開復(fù)感嘆,一個(gè)大模型公司同時(shí)做To B和To C(用戶端)是很辛苦的,需要多元化的管理方式,因?yàn)閮蓚€(gè)團(tuán)隊(duì)的基因不一樣,做事的方法和衡量KPI(關(guān)鍵績(jī)效指標(biāo))的方法都不太一樣,不過(guò)零一萬(wàn)物根據(jù)不同的市場(chǎng)特性進(jìn)行海內(nèi)外市場(chǎng)的商業(yè)化布局。
具體來(lái)說(shuō),零一萬(wàn)物將C端產(chǎn)品商業(yè)化重心放在海外市場(chǎng),因?yàn)?ldquo;國(guó)內(nèi)流量越來(lái)越貴,而國(guó)外的C端產(chǎn)品,獲客成本和變現(xiàn)能力能算得過(guò)賬”。在國(guó)內(nèi),零一萬(wàn)物優(yōu)先尋找B端機(jī)會(huì),李開復(fù)表示,零一萬(wàn)物已經(jīng)找到了破局的空間,就是用數(shù)字人做零售和餐飲等領(lǐng)域的直播和短視頻,做完整的解決方案。
李開復(fù)重申了“不做賠錢的To B”這一觀點(diǎn),他稱零一萬(wàn)物大模型To B的打法,首要任務(wù)是要尋找少數(shù)能夠按使用情況收費(fèi)的方法,拿到高利潤(rùn)率的訂單,而不是項(xiàng)目定制的方法。他同時(shí)透露,除了已經(jīng)發(fā)布的AI 2.0數(shù)字人、API之外,零一萬(wàn)物目前還有AI Infra解決方案、私有化定制模型等其他To B業(yè)務(wù),會(huì)在近期正式對(duì)外發(fā)布。
不用執(zhí)著于縮短時(shí)間差
提到國(guó)內(nèi)大模型,有一個(gè)永遠(yuǎn)繞不開的問題,就是中國(guó)與美國(guó)頂尖大模型技術(shù)的差距有多大?經(jīng)過(guò)過(guò)去一年的百花齊放,中美大模型差距是否縮小?如何追趕國(guó)外頂尖大模型?
對(duì)此,李開復(fù)給出了具體數(shù)字:GPT-4o在5月13日發(fā)布,Yi-Lightening在10月把它打敗,零一萬(wàn)物和美國(guó)頂尖模型之間的差距是5個(gè)月,而在5個(gè)月前發(fā)布千億參數(shù)Yi-Large閉源模型時(shí),李開復(fù)的答案是6個(gè)月,在他看來(lái),這已經(jīng)是全體國(guó)內(nèi)創(chuàng)業(yè)者努力的最好結(jié)果。
當(dāng)被問及中國(guó)大模型如何繼續(xù)和美國(guó)大模型縮短時(shí)間差時(shí),李開復(fù)坦言,繼續(xù)縮短時(shí)間差非常困難,“我不預(yù)測(cè)我們可以縮短這個(gè)時(shí)間差”。
“畢竟人家是用10萬(wàn)張GPU(圖形處理器)訓(xùn)練出來(lái)的,我們是用2000張GPU訓(xùn)練出來(lái),我們時(shí)間差能縮小到5個(gè)月是因?yàn)槲覀兡P?、AI infra(人工智能基礎(chǔ)設(shè)施)等團(tuán)隊(duì)都熱心且聰明,去使用和理解對(duì)方做出來(lái)的東西,再加上我們自己每家的研發(fā)有特色,比如數(shù)據(jù)處理、訓(xùn)推優(yōu)化等。”李開復(fù)表示。
據(jù)他透露,零一萬(wàn)物目前的成熟方法論就是,通過(guò)創(chuàng)新加上自身的特長(zhǎng),關(guān)注OpenAI和其他公司發(fā)布的新技術(shù),盡快了解這些技術(shù)的核心,然后把它的能力在自身的產(chǎn)品里面發(fā)揮出來(lái)。
“我覺得用這套方法將中美大模型差距保持在6個(gè)月左右,而且國(guó)內(nèi)不僅是零一萬(wàn)物,也有其他公司做得差不多,已經(jīng)是很好的結(jié)果了,很多中美公司都在往GPT-o1的方向狂奔。”李開復(fù)表示。
封面圖片來(lái)源:視覺中國(guó)
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP