每日經(jīng)濟(jì)新聞

要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

“百模大戰(zhàn)”周年考|國(guó)內(nèi)大模型盤點(diǎn)：305個(gè)大模型發(fā)布，備案率約四成，如何尋找變現(xiàn)、破局之路

每日經(jīng)濟(jì)新聞 2024-05-17 16:34:12

◎ 截至5月16日，國(guó)內(nèi)發(fā)布的305個(gè)大模型中約有六成尚未成功備案。一名大模型行業(yè)創(chuàng)業(yè)者告訴每經(jīng)記者，沒(méi)備案的大模型也不代表就消失在市面上。對(duì)于大模型的商業(yè)化，有行業(yè)人士認(rèn)為，當(dāng)下和未來(lái)兩三年，大模型的商業(yè)探索會(huì)在成本和Token質(zhì)量上相互妥協(xié)，并逐漸分化為兩派。

每經(jīng)記者可楊楊卉每經(jīng)編輯蘭素英

【編者按】：

本周，OpenAI推出新一代旗艦AI模型——GPT-4o。而早在2023年3月15日，GPT-4就已正式問(wèn)世，其強(qiáng)大的文本生成能力迅速使生成式AI成為全球焦點(diǎn)，掀起了一場(chǎng)AI技術(shù)競(jìng)賽的浪潮。

在國(guó)內(nèi)，生成式大模型的發(fā)布同樣風(fēng)起云涌。2023年3月16日，百度發(fā)布“文心一言”大模型；2023年4月10日，商湯科技的日日新發(fā)布；2023年4月11日，阿里巴巴的通義千問(wèn)發(fā)布；2023年7月7日，華為云推出盤古大模型3.0……各方力量爭(zhēng)先恐后，爭(zhēng)奇斗艷，這股熱潮被形象地稱為“百模大戰(zhàn)”。

那么，一年多過(guò)去了，國(guó)內(nèi)大模型企業(yè)的發(fā)展現(xiàn)狀如何？硅谷的生態(tài)又有怎樣的新變化？在這一領(lǐng)域中，科技巨頭和初創(chuàng)企業(yè)展現(xiàn)出了怎樣的發(fā)展方向？對(duì)此，《每日經(jīng)濟(jì)新聞》特推出《“百模大戰(zhàn)”周年考》策劃，深入探討這些問(wèn)題。

一年前的3月15日，隨著OpenAI多模態(tài)預(yù)訓(xùn)練大模型GPT-4的發(fā)布，國(guó)內(nèi)包括百度、華為、騰訊等科技巨頭，百川智能等初創(chuàng)企業(yè)，以及智譜AI研究院等研究機(jī)構(gòu)紛紛揚(yáng)帆起航，投身到人工智能（AI）大模型開發(fā)，試圖搭上這趟時(shí)代的列車，轟轟烈烈的“百模大戰(zhàn)”也由此開啟。

據(jù)《每日經(jīng)濟(jì)新聞》記者的不完全統(tǒng)計(jì)，截至今年4月底，國(guó)內(nèi)共計(jì)推出了305個(gè)大模型。而截至5月16日，只有約140個(gè)大模型完成生成式人工智能服務(wù)備案，占發(fā)布總量的45.9%。這意味著，還有約165個(gè)大模型尚未獲得“過(guò)審”機(jī)會(huì)。

這一嚴(yán)峻現(xiàn)實(shí)的背后除了有技術(shù)層面的難度，還有訓(xùn)練和推理過(guò)程中高昂算力成本的制約；即便是跨過(guò)這一關(guān)，大模型企業(yè)如何實(shí)現(xiàn)商業(yè)化，依然著面臨不小的難度。而對(duì)這場(chǎng)競(jìng)賽中可能被“出局”的公司來(lái)說(shuō)，未來(lái)的路又在何方呢？

現(xiàn)狀：305個(gè)大模型發(fā)布，僅約四成完成備案

GPT-4的發(fā)布在全球掀起了“煉大模型”的熱潮，面對(duì)這一新藍(lán)海，科技巨頭、初創(chuàng)企業(yè)以及科研院校相繼開啟布局，沒(méi)人想錯(cuò)過(guò)這趟時(shí)代的列車。

據(jù)《每日經(jīng)濟(jì)新聞》不完全統(tǒng)計(jì)，截至今年4月底，國(guó)內(nèi)共推出了約305個(gè)大模型，在過(guò)去一年推動(dòng)著語(yǔ)言理解、圖像識(shí)別等多個(gè)領(lǐng)域的技術(shù)進(jìn)步。

圖片來(lái)源：每經(jīng)制圖

截至2024年5月16日，國(guó)內(nèi)共有約140個(gè)大模型完成生成式人工智能服務(wù)備案，占305個(gè)大模型的45.9%左右。

此前，國(guó)家網(wǎng)信辦有關(guān)負(fù)責(zé)人就《辦法》相關(guān)問(wèn)題回答媒體提問(wèn)時(shí)介紹，《辦法》規(guī)定，利用生成式人工智能技術(shù)向中華人民共和國(guó)境內(nèi)公眾提供生成文本、圖片、音頻、視頻等內(nèi)容的服務(wù)，適用本辦法。

在已備案的大模型中，在地域分布上，北京以70個(gè)備案大模型領(lǐng)跑全國(guó)，凸顯了其在AI領(lǐng)域的集聚效應(yīng)。上海和廣東緊隨其后，分別有28個(gè)和19個(gè)模型備案。

圖片來(lái)源：每經(jīng)制圖

而“140”這一數(shù)字同時(shí)也意味著，從備案層面來(lái)看，大約還有165個(gè)大模型依舊未通過(guò)備案，無(wú)法公開向公眾提供服務(wù)。這些尚未能“過(guò)審”的大模型中，不乏一些備受關(guān)注的明星項(xiàng)目，包括曾號(hào)稱是“國(guó)內(nèi)首個(gè)ChatGPT”的元語(yǔ)智能大模型ChatYuan。

更多未完成備案的是“學(xué)院派”大模型。在305個(gè)大模型中，有60個(gè)大模型是由大學(xué)或研究院所研發(fā)?；蛟S是由于研究機(jī)構(gòu)的項(xiàng)目更偏重學(xué)術(shù)探索，而非商業(yè)應(yīng)用，備案動(dòng)力或流程可能不如企業(yè)迅速。也有大模型轉(zhuǎn)向“境內(nèi)深度合成服務(wù)算法”備案，例如恒生電子的大模型。

一名大模型行業(yè)創(chuàng)業(yè)者對(duì)《每日經(jīng)濟(jì)新聞》記者介紹稱，當(dāng)前模型相關(guān)的備案申請(qǐng)有點(diǎn)像專利申請(qǐng)，并不一定會(huì)通過(guò)，且申請(qǐng)周期較長(zhǎng)，約在4~6個(gè)月。他表示，當(dāng)下，大模型只要做To C服務(wù)，就需要備案，而在B端，一些大客戶會(huì)要求大模型公司完成備案工作。

不過(guò)他同時(shí)強(qiáng)調(diào)，沒(méi)備案的大模型也不代表就消失在市面上，很多來(lái)自研究所、大學(xué)的大模型僅僅只用于研究，就沒(méi)有動(dòng)機(jī)去完成備案。

一家大模型頭部企業(yè)從業(yè)人士也告訴記者，來(lái)自大學(xué)的大模型，如果只做自己學(xué)術(shù)范圍內(nèi)的研究，是可以不用備案的。

“百模大戰(zhàn)”行至此時(shí)，最終留下3~5家大模型已經(jīng)成為行業(yè)對(duì)于這場(chǎng)競(jìng)賽最終結(jié)局的共識(shí)。“大模型這個(gè)行業(yè)（到最后）可能就不存在了，未來(lái)大模型就是幾個(gè)最基本的底座，只有少數(shù)的幾家公司。”行行AI董事長(zhǎng)、順福資本創(chuàng)始人李明順曾在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)坦言。

難點(diǎn)：成本高，日活千萬(wàn)需年入超100億元才能覆蓋數(shù)據(jù)中心成本

算力資源的稀缺性是制約大模型發(fā)展的關(guān)鍵瓶頸。對(duì)不少大模型來(lái)說(shuō)，沒(méi)能挺過(guò)一周年，難搞的算力要負(fù)很大責(zé)任。對(duì)于模型廠商而言，目前主要的算力成本包括預(yù)訓(xùn)練成本和推理成本。模型推理應(yīng)用階段對(duì)算力的需求要遠(yuǎn)遠(yuǎn)高于訓(xùn)練階段。

據(jù)中國(guó)工程院院士鄭緯民計(jì)算，在大模型訓(xùn)練的過(guò)程中，70%的開銷要花在算力上；推理過(guò)程中95%的花費(fèi)也是在算力上。

以GPT-4為例，該模型的訓(xùn)練需要一萬(wàn)塊英偉達(dá)A100芯片跑上11個(gè)月。假設(shè)每塊A100的成本為10000美元（價(jià)格因供應(yīng)商和購(gòu)買數(shù)量而異），那么一萬(wàn)塊A100的總成本約為1億美元。

對(duì)于許多急匆匆踏上大模型賽道的創(chuàng)業(yè)公司或科技企業(yè)來(lái)說(shuō)，在“燒”了一陣子錢后，他們絕望地發(fā)現(xiàn)，算力不僅越來(lái)越貴，質(zhì)量也開始下降。

鄭緯民表示，目前，市面上只有三類系統(tǒng)可支持大模型訓(xùn)練。其中，基于英偉達(dá)GPU的系統(tǒng)一卡難求；基于國(guó)產(chǎn)AI芯片的系統(tǒng)面臨國(guó)產(chǎn)卡應(yīng)用不足、生態(tài)系統(tǒng)有待改善的問(wèn)題；而基于超級(jí)計(jì)算機(jī)的系統(tǒng)，雖然可在作好軟硬件協(xié)同設(shè)計(jì)的情況下實(shí)現(xiàn)大模型訓(xùn)練，但需在超算機(jī)器尚未飽和的前提下操作，私人企業(yè)獲得超算設(shè)備的機(jī)會(huì)并不大。

據(jù)英特爾方面介紹，在大模型領(lǐng)域，去年關(guān)注點(diǎn)更多是在模型訓(xùn)練上，對(duì)成本和功耗并不那么重視，彼時(shí)，企業(yè)都希望能訓(xùn)練一個(gè)自己的通用大模型。隨著很多通用大模型被訓(xùn)練出來(lái)，今年關(guān)注的重點(diǎn)則轉(zhuǎn)移到了推理。對(duì)企業(yè)來(lái)說(shuō)，大模型訓(xùn)練出來(lái)是需要變現(xiàn)且能夠盈利的。但目前市場(chǎng)上很多大模型都是基于開源的，性能差不多，用于訓(xùn)練的數(shù)據(jù)也差不多，很難通過(guò)差異化來(lái)盈利。

沒(méi)有足夠的資金支撐推理過(guò)程，成了很多創(chuàng)業(yè)者敗退的原因之一。為了降低成本，部分企業(yè)正在嘗試探索是否可以用CPU來(lái)做大模型推理。從當(dāng)前一些案例來(lái)看，在130億參數(shù)以下的大模型中，CPU是可以做到的這一點(diǎn)的。

然而，即便是熬過(guò)了推理關(guān)，企業(yè)要將大模型變現(xiàn)仍有不小的難度。在行云集成電路創(chuàng)始人季宇看來(lái)，大模型的商業(yè)落地與早期互聯(lián)網(wǎng)時(shí)代相比區(qū)別很大，邊際成本仍然非常高。大模型每增加一個(gè)用戶，基礎(chǔ)設(shè)施需增加的成本是肉眼可見的，一個(gè)月幾十美元的訂閱費(fèi)用根本不足以抵消背后高昂的成本。

更為關(guān)鍵的是，眼下大模型要大規(guī)模商業(yè)化，在模型質(zhì)量、上下文長(zhǎng)度等方面還有進(jìn)一步訴求，不排除會(huì)進(jìn)一步增加邊際成本。目前來(lái)看，日活千萬(wàn)的通用大模型一年需超過(guò)100億元的收入才能支撐其背后的數(shù)據(jù)中心成本，未來(lái)大模型要像互聯(lián)網(wǎng)產(chǎn)業(yè)一樣服務(wù)上億人，成本一定是邁不過(guò)去的檻。

尋找新“航道”：投身應(yīng)用或?qū)Ｗ⒋诡惣?xì)分行業(yè)

如果說(shuō)“百模大戰(zhàn)”最后的贏家只屬于少數(shù)幾家公司，那在這場(chǎng)賽事中被淘汰的公司，未來(lái)會(huì)走向何方？

昆侖萬(wàn)維董事長(zhǎng)方漢曾在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示，“百模大戰(zhàn)”會(huì)淘汰一部分公司，剩下的科技公司肯定會(huì)繼續(xù)全速前進(jìn)。

在行云集成電路創(chuàng)始人季宇看來(lái)，當(dāng)下和未來(lái)兩三年，大模型的商業(yè)探索會(huì)在成本和Token質(zhì)量上相互妥協(xié)，并逐漸分化為兩派。

一派是質(zhì)量?jī)?yōu)先，用高端系統(tǒng)打造高質(zhì)量的通用大模型，尋找超級(jí)應(yīng)用來(lái)覆蓋高昂的成本。另一派是成本優(yōu)先，用足夠便宜的硬件提供基本夠用的Token質(zhì)量，尋找垂直場(chǎng)景的落地。若能在同樣的成本下買到規(guī)格大得多的芯片，跑一個(gè)百億千億模型，支持超長(zhǎng)上下文，商業(yè)化的空間會(huì)比今天大得多，就像曾經(jīng)的顯卡和游戲行業(yè)一樣。

啟明創(chuàng)投合伙人周志峰認(rèn)為，當(dāng)下，絕大多數(shù)的大模型企業(yè)是包著大模型的皮，裹著應(yīng)用的心，“擁有模型能力的團(tuán)隊(duì)更容易在算法、模型、數(shù)據(jù)、模型的加速方面去做優(yōu)化，以達(dá)到體驗(yàn)更好的產(chǎn)品，尤其對(duì)比那些用第三方模型純粹做應(yīng)用的公司。這一類公司其實(shí)不是模型公司，未來(lái)一定會(huì)是一家應(yīng)用公司”。

周志峰以字節(jié)跳動(dòng)為例，從今日頭條到抖音到TikTok，背后的軸是AI驅(qū)動(dòng)的推薦引擎。“字節(jié)跳動(dòng)第一輪、第二輪融資的時(shí)候跟我們投資人講得更多的故事是AI驅(qū)動(dòng)的推進(jìn)引擎，而今天不會(huì)再去說(shuō)字節(jié)跳動(dòng)是一家AI技術(shù)公司，只會(huì)記得是哪幾個(gè)應(yīng)用造成了這么大的規(guī)模。”同理，今天大部分的大模型公司未來(lái)也一定是靠它最終闖出了超級(jí)應(yīng)用，大家因?yàn)檫@個(gè)超級(jí)應(yīng)用而記住這家公司。

李明順也持同樣的觀點(diǎn)，即不遠(yuǎn)的未來(lái)，有一部分大模型公司要轉(zhuǎn)型成應(yīng)用公司，因?yàn)榇竽Ｐ皖I(lǐng)域不需要這么多公司，“有一些大模型公司的創(chuàng)始人有Plan A和Plan B的雙計(jì)劃，就是一旦我的模型實(shí)在是拼不過(guò)前面的5家之后，就要被迫在一些垂直領(lǐng)域里面找到生存之地，它就會(huì)轉(zhuǎn)型為一家應(yīng)用公司。”

在備案成功的大模型中，部分模型已經(jīng)從通用型轉(zhuǎn)變?yōu)榫劢固囟I(lǐng)域或行業(yè)的細(xì)分垂類模型。

中科聞歌董事長(zhǎng)王磊在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)坦言，在過(guò)去的半年到一年內(nèi)，適當(dāng)做小行業(yè)大模型，降低參數(shù)規(guī)模的趨勢(shì)已經(jīng)變得非常明顯。真正成功的商業(yè)應(yīng)用不是制造一個(gè)巨無(wú)霸，而是能夠被用戶廣泛使用且價(jià)格適中。“實(shí)用至上是關(guān)鍵，不必為了面子而去追求大規(guī)模，高昂的代價(jià)會(huì)影響產(chǎn)品的市場(chǎng)推廣和用戶的使用，實(shí)用性才是商業(yè)發(fā)展的主導(dǎo)原則。”

王磊表示，目前國(guó)內(nèi)企業(yè)都意識(shí)到，最受歡迎的規(guī)模是70億和130億，300億是單臺(tái)推理的參數(shù)規(guī)模，比較受歡迎。“在我們的大模型發(fā)布時(shí)，國(guó)外網(wǎng)友評(píng)價(jià)這是企業(yè)級(jí)應(yīng)用的小型參數(shù)規(guī)格。我認(rèn)為一般的企業(yè)可能難以承受更大規(guī)模的產(chǎn)品。對(duì)于文本生成任務(wù)，這個(gè)規(guī)?；旧鲜亲銐虻?，但對(duì)于一些特定領(lǐng)域的任務(wù)，還需要強(qiáng)化模型的能力。”

第四范式也同樣堅(jiān)定選擇投入行業(yè)大模型。“如果說(shuō)無(wú)限把模型做大，往里面放無(wú)限多的數(shù)據(jù)，最后可能會(huì)達(dá)到AGI的狀態(tài)，但是在每一個(gè)垂直應(yīng)用，我們都要平衡好能力以及代價(jià)”。創(chuàng)始人戴文淵此前在第四范式的業(yè)績(jī)溝通會(huì)上也表示，從技術(shù)的角度來(lái)說(shuō)，第四范式也追求AGI，但是與此同時(shí)，“對(duì)于每一個(gè)客戶的具體場(chǎng)景，我們也要做一定的裁剪，比如說(shuō)這個(gè)考試只考數(shù)學(xué)，不一定需要讓它有物理的能力。”

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

模型大模型 Ai 算力科技

上一篇文章

在岸人民幣兌美元收盤報(bào)7.2242，較上一交易日下跌54點(diǎn)

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

新奧股份：部分董事及高管擬合計(jì)減持不超92.42萬(wàn)股

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁(yè)

Copyright ? 2025 每日經(jīng)濟(jì)新聞報(bào)社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會(huì)征信網(wǎng)

兒童色情信息舉報(bào)專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

四川省互聯(lián)網(wǎng)舉報(bào)中心

中國(guó)互聯(lián)網(wǎng)舉報(bào)中心

每日經(jīng)濟(jì)新聞互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號(hào)：蜀ICP備19004508號(hào)-3 川公網(wǎng)安備 51019002002026號(hào)

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人在线免费