每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

“百模大戰(zhàn)”鏖戰(zhàn)正酣,“賣水人”過得如何?創(chuàng)業(yè)者、投資人這樣說

每日經濟新聞 2024-03-22 17:40:23

每經記者 姚亞楠    每經編輯 彭水萍

“百模大戰(zhàn)”進入下半場,在大模型底座的國產化浪潮和應用層的火熱之外,一些原本并不起眼的中間層公司開始走入公眾視野。

一個被反復提及的例子是,大洋彼岸一家名為Scale AI的數(shù)據服務公司被爆2023年年化收入運行率(annualized revenue run-rate)達到7.5億美元,猛增3倍,一躍成為當前收入最高的AI初創(chuàng)公司之一,比肩OpenAI。

事實上,在底層大模型和最上層是各類應用之外,還有大量的中間環(huán)節(jié),包括數(shù)據處理、模型訓練、工具開發(fā)等等,海外新興的大模型創(chuàng)業(yè)公司也大多集中在中間層和應用層。

“當所有人都在掘金時,你就應該賣鏟子”,如今國內“百模大戰(zhàn)”鏖戰(zhàn)正酣,這些提供基礎設施服務的“賣水人”過得如何?近日,《每日經濟新聞》記者進行了多方采訪。

行業(yè)淘汰賽提前拉開帷幕

章磊此前在海外從事算法工作,深知數(shù)據的重要性,2017年回國后,他發(fā)現(xiàn)國內市場在數(shù)據基礎設施方面存在缺失,于是著手創(chuàng)立了星塵數(shù)據。

訓練一個大模型,數(shù)據處理工作就要占到60%,對于ChatGPT引爆的這一輪AIGC創(chuàng)業(yè)潮,星塵數(shù)據的感受很直觀。“我們接到大模型和數(shù)據管理的訂單明顯增多,這類業(yè)務目前在公司占比有三成左右”,章磊向《每日經濟新聞》記者介紹稱,這一年來,隨著技術的演進和應用的深入,大模型公司的數(shù)據處理需求復雜度也隨之攀升:從最初的獲取基座模型預訓練的數(shù)據集,到對模型進行SFT(supervised fine-tuning)調整,進一步地,隨著行業(yè)應用的深入,出現(xiàn)了對特定垂直領域的定制化和專業(yè)化數(shù)據需求,以及對大模型能力進行評估的benchmark評測,數(shù)據處理的難度不斷加大。此外,在數(shù)據模態(tài)的演進過程中,客戶需求也從處理單一模態(tài)數(shù)據轉變?yōu)樘幚矶嗄B(tài)數(shù)據集,模型的訓練過程也由靜態(tài)的數(shù)據處理轉向了動態(tài)的交互式人類反饋。

得益于大模型的火熱,大洋彼岸一家名為Scale AI的數(shù)據服務公司2023年營收增長迅猛,一躍成為收入比肩OpenAI的AI初創(chuàng)公司之一,引發(fā)市場對數(shù)據服務的關注。在國內,雖然底層大模型掀起國產化浪潮,應用層生態(tài)迎來百花齊放,但章磊說,數(shù)據服務公司還沒有如愿迎來悶聲賺大錢的舒服日子;恰恰相反,隨著大模型客戶對數(shù)據服務要求的進一步提高,行業(yè)淘汰賽提前拉開帷幕,很多單純依靠廉價勞動力做純手工數(shù)據標注的公司已經倒下。

“大模型公司對于高質量標注數(shù)據有著持續(xù)強烈的需求,但單純拼低價人力的數(shù)據標注商無法提供與之匹配的服務。此外,國內以自動駕駛公司為代表的客戶不僅回款慢,并且其采購體系存在一定問題,這使得國內數(shù)據標注行業(yè)很難以最高效率運行,不少公司直接被拖垮了”,章磊向記者分析稱。

不過,市場需求仍在加速釋放,隨著科技大廠、算法公司等更多玩家參與其中,自動化標注及更智能的數(shù)據閉環(huán)產品涌現(xiàn),整個行業(yè)正從勞動密集型向技術密集型轉變,新興的數(shù)據服務公司需要開拓出屬于自己的成長空間。

章磊告訴記者,在AI數(shù)據的整個生命周期當中,數(shù)據標注只是其中非常小的一部分,星塵數(shù)據的應對策略是,從數(shù)據標注向搭建數(shù)據基礎設施進化,培養(yǎng)經驗豐富的數(shù)據策略專家,推出AI全生命周期數(shù)據管理平臺MorningStar,幫助客戶建立高效的數(shù)據閉環(huán)系統(tǒng),實現(xiàn)數(shù)據價值最大化和模型效果最優(yōu)化。

投資“賣水人”,VC/PE有點糾結

Scale AI如今估值超70億美元,背后有Y Combinator、Tiger Globa等諸多知名機構支持,國內投資人如何看待這波“賣水人”的機遇?

創(chuàng)世伙伴資本合伙人聶冬辰長期關注AI領域的早期投資機遇,過去一年,圍繞著AIGC這座金礦,以及金礦邊的“賣水人”,聶冬辰看過很多項目,他看好包括數(shù)據處理、模型訓練、工具開發(fā)在內的中間環(huán)節(jié)短期內存在一定的創(chuàng)業(yè)與投資機遇。

“AIGC這個產業(yè)鏈上,最賺錢的環(huán)節(jié)要么是大模型底座,要么是離用戶更近的上層應用,中間環(huán)節(jié)相比上下游來看,天花板和價值可能相對偏低一些”,聶冬辰表示。

九合創(chuàng)投創(chuàng)始人王嘯也認可中間環(huán)節(jié)的價值,“大模型部署到業(yè)務流程中,有適配的成本,使用大模型有訓練和推理成本,中間層可以幫助使用大模型的企業(yè)降本增效”。不過,當前大模型公司的主要目標是交付更高水平的大模型,到實現(xiàn)商業(yè)化還有一段距離。長期來看,大模型公司需要找到商業(yè)化的路徑,王嘯擔心這個過程可能會擠壓“賣水人”的利潤,因此,現(xiàn)階段他更關注應用層的機會。

王嘯向記者舉例稱,九合創(chuàng)投在國內也看到過類似Scale AI的項目,“但國內和國外的商業(yè)環(huán)境不同,國內的AI公司更關注數(shù)據能否和模型業(yè)務更好的貼合,大多傾向于在公司內部處理數(shù)據,以更好的控制數(shù)據質量”。

不過,上述擔憂并非無解,聶冬辰認為,對于這類公司而言,出海是一個很好的選擇。海外市場產業(yè)鏈分工更清晰明確,企業(yè)付費意識普遍更強,這些公司面臨上下游公司的擠壓會少一些,“如果產品能力足夠強,有能力進入到海外巨大的市場,那么企業(yè)的成長空間還是足夠大的”。

市場“日更”,創(chuàng)業(yè)者心態(tài)變了

在近來與創(chuàng)業(yè)者的接觸中,聶冬辰明顯感覺到創(chuàng)始人的心態(tài)有了很大變化,“去年大模型剛誕生時,我們接觸到的創(chuàng)業(yè)者大多斗志昂揚,充滿期待憧憬,摩拳擦掌想要做出點什么來。但今年以來,尤其是文生視頻大模型Sora橫空出世,很多創(chuàng)業(yè)者的感受是無奈”,聶冬辰說,OpenAI的一次產品迭代可能就瞬間抹掉了部分創(chuàng)業(yè)者一年來的技術積累和優(yōu)勢,游戲規(guī)則頃刻改變。

不過,即便在大模型在以“日更”進展的當下,聶冬辰認為,部分領域依然存在機會,值得創(chuàng)業(yè)者努力。首先是垂直領域模型,這些行業(yè)由于其數(shù)據的獨特性和封閉性,往往難以被OpenAI或大型科技公司的通用模型所充分覆蓋,創(chuàng)業(yè)者如果專注于這些數(shù)據壁壘較高的領域,利用對行業(yè)深入的理解和專業(yè)知識,可以開發(fā)出針對這些行業(yè)的定制化模型。

其次是硬件領域,OpenAI作為一家以軟件為核心的公司,未來會持續(xù)提升其模型的性能,同時積極尋找市場上的新興應用,整合到其基礎功能中以擴展軟件的覆蓋范圍,但是對于與硬件直接相關的領域,OpenAI可能不會親自投入太多精力,中國公司在智能硬件制造方面有很強的實力,大模型與智能硬件的結合是他今年重點關注的方向。

“今年我們對大模型項目是否有造血能力的考察比重繼續(xù)在增加”,王嘯告訴《每日經濟新聞》記者,在大模型訓練成本普遍較高的情況下,創(chuàng)業(yè)公司要更加關注變現(xiàn),在當前的環(huán)境下如果自身造血能力短期內無法跟上,會非??简瀳F隊的融資能力。今年他將對大模型應用層的機會持續(xù)保持關注,包括多模態(tài)的發(fā)展、具身智能、垂直行業(yè)AI應用、To C應用場景等。

封面圖片來源:視覺中國-VCG41N1408722861

如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

數(shù)據 模型 投資 創(chuàng)業(yè) 基金投資

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人 在线 免费