每日經(jīng)濟(jì)新聞 2024-08-13 21:56:32
每經(jīng)記者 可 楊 每經(jīng)編輯 張海妮
由史蒂文·斯皮爾伯格(Steven Spielberg)執(zhí)導(dǎo)的電影《人工智能》,講述的是一個(gè)小男孩最終發(fā)現(xiàn)自己是人工智能的故事。
人工智能什么時(shí)候才能達(dá)到這樣的水平?難道人工智能的作用就是制造一個(gè)類人智能體嗎?這是第四范式創(chuàng)始人、董事長(zhǎng)戴文淵投身人工智能產(chǎn)業(yè)早期最令他迷惑的兩個(gè)問(wèn)題。
最終,他在圖靈獎(jiǎng)獲得者詹姆斯·尼古拉·格雷(James Nicholas Gray,昵 稱 Jim Gray)2007年《科學(xué)發(fā)展的四個(gè)范式》的演講中找到答案。其中,第四范式階段是指數(shù)據(jù)科學(xué)——隨著數(shù)據(jù)爆發(fā)式增長(zhǎng)以及技術(shù)演進(jìn),科學(xué)理論由計(jì)算機(jī)從海量數(shù)據(jù)中發(fā)現(xiàn)。
視覺(jué)中國(guó)
戴文淵所創(chuàng)立的人工智能公司“第四范式”的名字也由此而來(lái)。這家成立于2014年的企業(yè)級(jí)人工智能平臺(tái)企業(yè),迎著人工智能的潮起與潮落成長(zhǎng)至今,作為掌舵者,戴文淵向《每日經(jīng)濟(jì)新聞》記者分享的心得是,不要太在乎AI(人工智能)是不是能做所有事,或者不能做所有事,因?yàn)檫@對(duì)于市場(chǎng)來(lái)說(shuō)也不重要,客戶關(guān)心的問(wèn)題是:“我是賣雞翅的,AI能做的所有的事情,跟我有什么關(guān)系?重要的是我的雞翅能不能(通過(guò)AI)賣得更好。”
大模型時(shí)代,第四范式主張對(duì)模型進(jìn)行“剪裁”,以求用最“經(jīng)濟(jì)”的方式做領(lǐng)先的AI。在戴文淵眼中,通用大模型和行業(yè)大模型是實(shí)現(xiàn)AGI(通用人工智能)的不同路徑,區(qū)別在于是用一個(gè)模型去實(shí)現(xiàn)AGI,還是用很多模型去實(shí)現(xiàn)AGI。而兩相比較之下,行業(yè)大模型是他認(rèn)為最經(jīng)濟(jì)的方式。
熱潮與誤解一同翻涌,市場(chǎng)期望AI解決所有問(wèn)題
新的熱浪翻涌在第四范式成立的第十年,這也促使戴文淵作出了一些改變。
2023年,很多人找到戴文淵,問(wèn)他:“ChatGPT會(huì)怎么幫助到我的企業(yè)?”上一次他被問(wèn)及類似的問(wèn)題是在2016年,那時(shí),問(wèn)句的主語(yǔ)是AlphaGO。
更有趣的是,這一次,幾乎所有的客戶、投資人、媒體記者都在使用“技術(shù)的語(yǔ)言”來(lái)提問(wèn),“參數(shù)”成為高頻詞,與之前的狀況大不相同。
戴文淵說(shuō):“要把AI做好,就先不要談AI的問(wèn)題,先談?wù)劰臼亲鍪裁吹?,把這些問(wèn)題談清楚,咱們?cè)倩仡^看看AI是不是可以(對(duì)公司)有幫助。”
市場(chǎng)和客戶都對(duì)新技術(shù)感到興奮時(shí),戴文淵希望能借此機(jī)會(huì)引導(dǎo)一個(gè)正確的“AI價(jià)值觀”:“不能先把參數(shù)做到一千億,再想這千億的參數(shù)到底能干什么?”
市場(chǎng)期望AI解決所有的問(wèn)題,這反映了一種恐慌心理:萬(wàn)一 AI能做但是自己沒(méi)有用到,那可能會(huì)失去一些機(jī)會(huì)。戴文淵將此視為一個(gè)機(jī)遇,“擔(dān)憂”打開(kāi)了世人想要了解AI的窗子,但誤解也同熱潮一同翻涌,第四范式要做的,是把AI的價(jià)值帶到眾人面前。
ChatGPT,這個(gè)目前最火爆的大模型應(yīng)用,將大模型帶到了人工智能圈層以外的世界。熱浪之下,一些人對(duì)于大模型的理解或許是:和ChatGPT一樣的技術(shù)。
直至今天,市場(chǎng)中最受關(guān)注的大模型依舊是以大語(yǔ)言模型為主,即“預(yù)測(cè)下一個(gè)字”的模型,年初爆火的Sora則是“預(yù)測(cè)下一幀畫面”的模型。
但應(yīng)用是更加實(shí)際的事,對(duì)于絕大多數(shù)企業(yè)而言,“預(yù)測(cè)下一個(gè)字”解決不了核心問(wèn)題。例如,金融機(jī)構(gòu)需要解決風(fēng)控問(wèn)題,但這不是語(yǔ)言問(wèn)題;大語(yǔ)言模型可能會(huì)輔助金融機(jī)構(gòu)解決客服事宜,但這可能不是它的核心問(wèn)題。真正的行業(yè)大模型應(yīng)當(dāng)是針對(duì)不同場(chǎng)景,構(gòu)建不同模態(tài),去預(yù)測(cè)下一個(gè)“事情”。
這背后有一個(gè)更大的誤解——很多人問(wèn),能不能基于開(kāi)源大模型底座或GPT,訓(xùn)練行業(yè)需要的新模態(tài)模型。但即使同樣出自O(shè)penAI之手,要在GPT模型上直接精調(diào)出Sora,也是不可能的事情。
戴文淵介紹,大多數(shù)行業(yè)大模型是要基于特定業(yè)務(wù)所積累的特定模態(tài)的數(shù)據(jù),訓(xùn)練出一個(gè)基座大模型,就像目前訓(xùn)練底座的大語(yǔ)言模型、視頻模型一樣。
行業(yè)大模型這件事,其實(shí)已經(jīng)發(fā)生了十年之久。2014年,第四范式推出人工智能平臺(tái)——先知1.0,用建模型的方式,挖掘業(yè)務(wù)數(shù)據(jù)價(jià)值,提升業(yè)務(wù)效果。如今“先知”已經(jīng)迭代到了5.0版本,定位于降門檻,讓企業(yè)自行構(gòu)建高價(jià)值場(chǎng)景所需的行業(yè)大模型,例如預(yù)測(cè)疾病風(fēng)險(xiǎn)、欺詐行為、災(zāi)害險(xiǎn)情、設(shè)備故障等,打破大語(yǔ)言模型只能生成文字、圖像、視頻的局限。
信心不再是問(wèn)題,但市場(chǎng)的耐心有限
1956年夏天,在達(dá)特茅斯學(xué)院舉辦了一場(chǎng)人工智能研討會(huì),主題是研究“讓機(jī)器能像人那樣認(rèn)知、思考和學(xué)習(xí),即用計(jì)算機(jī)模擬人的智能”。這次會(huì)議被普遍視為人工智能技術(shù)的起點(diǎn)。由此出發(fā),人工智能開(kāi)始沿著一條波浪式的曲線前進(jìn),經(jīng)歷著巨大的潮起與潮落,穿梭在失望與希望之間。
兩到三年,戴文淵認(rèn)為這是市場(chǎng)能給一場(chǎng)技術(shù)熱潮的最大耐心。
距離我們最近的一次潮起被認(rèn)為來(lái)自2016年,基于強(qiáng)化學(xué)習(xí)算法的AlphaGo戰(zhàn)勝人類圍棋選手李世石,“機(jī)器是否會(huì)代替人類”在彼時(shí)引發(fā)市場(chǎng)關(guān)注,商湯科技、曠視科技等一批人工智能“獨(dú)角獸”站到臺(tái)前。
第四范式是一家幸運(yùn)的公司,這家公司誕生于2014年,從誕生的第一天就開(kāi)始做企業(yè)端的生意。不過(guò)那時(shí)候,很多企業(yè)告訴戴文淵,他們沒(méi)有人工智能預(yù)算。隨著AlphaGO成為那枚投向平靜水面的石子,突然之間,所有客戶都來(lái)問(wèn)他:“你們是人工智能企業(yè),你來(lái)給我講一講AlphaGO可以幫我做什么?”“我們有預(yù)算,我們要AlphaGO。”
兩三年的時(shí)間,人們理想中的人工智能工具沒(méi)有誕生,市場(chǎng)信心在2019年崩盤。據(jù)獵豹全球智庫(kù)數(shù)據(jù),與2018年相比,2019年中國(guó)人工智能企業(yè)的融資金額由1484.53億元下降至967.27億元,下降幅度達(dá)到34.8%,融資數(shù)量也由737個(gè)下降至431個(gè),下降幅度達(dá)四成。
直到ChatGPT成為下一顆石子,這場(chǎng)“寒冬”結(jié)束,AI市場(chǎng)再度迎來(lái)熱潮。
戴文淵認(rèn)為,在2023年以前,市場(chǎng)對(duì)AI是信心問(wèn)題。從2023年開(kāi)始,不再是信心問(wèn)題,而是要找到正確路徑的問(wèn)題。“不用擔(dān)心客戶認(rèn)為AI沒(méi)有用,需要解決的是,引導(dǎo)客戶反過(guò)來(lái)想業(yè)務(wù)的問(wèn)題。”戴文淵說(shuō)。
潮起潮落,似乎已經(jīng)成為人工智能行業(yè)的常態(tài)。潮為什么落,戴文淵認(rèn)為和價(jià)值相關(guān)。2016年,每家企業(yè)都陷入“怎么去用AlphaGO幫助到我”的問(wèn)題中,這個(gè)潮落了。今天也一樣,如果每家企業(yè)想的都是“怎么用ChatGPT幫助到我”,可能這個(gè)潮也會(huì)落。
戴文淵判斷,兩三年內(nèi),如果大模型不能創(chuàng)造出巨大的價(jià)值,可能就會(huì)再度潮落,等待下一顆“石子”——或許是一個(gè)新的能夠吸引眼球的東西,或許是能夠在合理的投入產(chǎn)出中創(chuàng)造出足夠價(jià)值的技術(shù)。
當(dāng)下的機(jī)遇是市場(chǎng)的目光重新被吸引,但挑戰(zhàn)在于,兩到三年內(nèi)能否兌現(xiàn)大模型的價(jià)值?
市場(chǎng)關(guān)注到人工智能“+”,戴文淵認(rèn)為這個(gè)加號(hào)非常重要,這意味著,未來(lái)兩到三年,人工智能有可能創(chuàng)造出很大的價(jià)值,如果大家想的都是ChatGPT能不能幫到企業(yè),不見(jiàn)得能創(chuàng)造市場(chǎng)預(yù)期的價(jià)值。
“以語(yǔ)言模型為例,去年主要的落地場(chǎng)景都與客服相關(guān),如果在這么大的關(guān)注度之下,落地的應(yīng)用全是問(wèn)答類場(chǎng)景,可能兩三年以后大家就失望了。”他說(shuō)。
AI是一個(gè)實(shí)驗(yàn)的過(guò)程,目標(biāo)是提升“北極星指標(biāo)”
目前來(lái)看,大模型賦能行業(yè),依舊是一個(gè)充滿前景的故事,因?yàn)槔碚撋喜淮嬖诖竽P蜔o(wú)法賦能的行業(yè),人效上可以充分發(fā)揮想象力。
目前,絕大多數(shù)企業(yè)的核心業(yè)務(wù)都由人來(lái)作決策,但人作決策時(shí)往往面臨兩個(gè)困境:水平參差不齊、精力有限。當(dāng)AI能力提升,哪怕其能力尚未全面超越人類,即便僅達(dá)到人類的平均水平,但如果能復(fù)制很多“人”,就很有可能提供更好的業(yè)務(wù)價(jià)值。
企業(yè)招聘員工時(shí),并非需要每個(gè)員工都達(dá)到頂尖水平,而是注重每個(gè)員工是否能為企業(yè)帶來(lái)積極的貢獻(xiàn)。因此,戴文淵認(rèn)為,盡管第四范式的目標(biāo)是使AI的表現(xiàn)超越絕大多數(shù)業(yè)務(wù)專家,但從實(shí)踐角度來(lái)看,AI即使僅僅達(dá)到專家平均的能力水平,也有可能為企業(yè)帶來(lái)顯著的價(jià)值提升。
從數(shù)字化時(shí)代開(kāi)啟到數(shù)智化時(shí)代來(lái)臨,賦能傳統(tǒng)企業(yè)與實(shí)體經(jīng)濟(jì)始終是市場(chǎng)對(duì)技術(shù)的期待。隨著大模型來(lái)臨,數(shù)字技術(shù)從傳統(tǒng)的信息搜集、傳輸、整理、儲(chǔ)存,逐漸走到輔助決策甚至替代決策階段。
戴文淵指出,一些企業(yè)當(dāng)前在使用AI時(shí),依舊存在數(shù)字化時(shí)代的慣性思維,即過(guò)于依賴同行業(yè)的成功案例,試圖直接移植成熟方案落地到本企業(yè)。但實(shí)際上AI和企業(yè)核心競(jìng)爭(zhēng)力相關(guān)以后,不同企業(yè)的目標(biāo)是不一樣的。
理想狀態(tài)下,大模型應(yīng)該能夠幫助企業(yè)完成核心決策。為此,第四范式將企業(yè)的戰(zhàn)略目標(biāo)轉(zhuǎn)化為計(jì)算機(jī)可以記錄和跟蹤的語(yǔ)言,即企業(yè)的“北極星指標(biāo)”,以此作為企業(yè)最核心的關(guān)鍵指標(biāo)。
戴文淵認(rèn)為,對(duì)于企業(yè)而言,在使用AI前,需要先想明白一點(diǎn):對(duì)于提升“北極星指標(biāo)”,什么叫好,什么叫不好。以實(shí)體零售企業(yè)為例,其核心效率體現(xiàn)在每平方米所貢獻(xiàn)的效益上,這可能就是一家零售企業(yè)的“北極星指標(biāo)”。所有圍繞這一指標(biāo)的改進(jìn),都需要量化其對(duì)“北極星指標(biāo)”的實(shí)際影響,無(wú)論是提升還是下降。
在實(shí)踐中,AI的應(yīng)用并不意味著每一步都能帶來(lái)提升。
“AI其實(shí)是一個(gè)實(shí)驗(yàn)的過(guò)程。”戴文淵舉例,假設(shè)有一百萬(wàn)的客戶基礎(chǔ),可能將九十萬(wàn)作為基線,剩余的十萬(wàn),每一萬(wàn)作為一個(gè)實(shí)驗(yàn)組,持續(xù)嘗試模型的優(yōu)化與迭代。“早期的實(shí)驗(yàn)基本上是成功的,每次實(shí)驗(yàn)都會(huì)比‘九十萬(wàn)’更好。但是到了一定階段絕大多數(shù)的實(shí)驗(yàn)都是失敗的,也沒(méi)有關(guān)系,往往到了一定的規(guī)模體量以后,一百次體驗(yàn)如果能成功一次,就能賺回前面九十九次失敗的所有成本。”戴文淵說(shuō)。
AI是一個(gè)實(shí)驗(yàn)的過(guò)程,這是戴文淵的認(rèn)知,但尚未在客戶中達(dá)成共識(shí)。
客戶的認(rèn)知提升是AI產(chǎn)業(yè)發(fā)展至關(guān)重要的一環(huán)。如果認(rèn)知遲遲沒(méi)有發(fā)生變化,AI會(huì)重新變成“需要有一個(gè)大模型、交付一個(gè)大模型,這個(gè)大模型的參數(shù)是不是1000億,是1000億就驗(yàn)收通過(guò)付款、結(jié)束”的過(guò)程,也許再經(jīng)過(guò)一年半載,客戶會(huì)覺(jué)得,大模型好像沒(méi)什么用。
這時(shí),熱潮可能將會(huì)再度遺憾告終。
AI是科學(xué)問(wèn)題,AI應(yīng)用是經(jīng)濟(jì)問(wèn)題
在通往AGI的路上,通用大模型和行業(yè)大模型是兩條不同的技術(shù)路線。戴文淵認(rèn)為,大家都是朝著AGI的方向前進(jìn),區(qū)別在于是用一個(gè)模型去實(shí)現(xiàn)AGI,還是用很多模型去實(shí)現(xiàn)AGI。
在他看來(lái),用一個(gè)模型去解決所有的問(wèn)題,不是最經(jīng)濟(jì)的。
戴文淵還提出了一個(gè)更為少見(jiàn)的觀點(diǎn):并不存在真正的通用大模型,所謂的通用大模型,本質(zhì)是將多種場(chǎng)景融入一個(gè)模型中。
第四范式的做法是,進(jìn)行剪裁,先做垂直的行業(yè)模型。如果模型僅針對(duì)某一特定場(chǎng)景進(jìn)行應(yīng)用,就先通過(guò)該場(chǎng)景的數(shù)據(jù)模態(tài)構(gòu)建專用模型,同樣參數(shù)量往往能實(shí)現(xiàn)更好的效果。相反,若模型被設(shè)計(jì)為一個(gè)通用大型模型,最后通用大模型應(yīng)用到某一具體場(chǎng)景,往往很可能是不經(jīng)濟(jì)的。
“經(jīng)濟(jì)”,在一個(gè)小時(shí)的采訪里,戴文淵至少5次提到這個(gè)詞。“我們致力于把這個(gè)問(wèn)題(解決),或者把這個(gè)技術(shù)做出來(lái),如果我選擇了不經(jīng)濟(jì)的一條路,可能最后我會(huì)做不出來(lái),我們要綜合考慮每一種方向,每一個(gè)路線所面臨的問(wèn)題,最后找到一個(gè)最有可能的解決方法。”戴文淵說(shuō)。
“做最領(lǐng)先的AI是特別貴的事,需要花很多錢。”或許正因?yàn)槿绱?,在技術(shù)信仰派和商業(yè)信仰派之爭(zhēng)中,戴文淵認(rèn)為自己處于兩者之間。
AI顯然是個(gè)科學(xué)問(wèn)題,但做出最領(lǐng)先的AI技術(shù),是個(gè)需要計(jì)算的經(jīng)濟(jì)問(wèn)題。
戴文淵認(rèn)為,經(jīng)營(yíng)一家AI技術(shù)公司,需要站在商業(yè)的角度思考問(wèn)題:最領(lǐng)先的AI技術(shù)需要海量的算力和數(shù)據(jù),如果不能和商業(yè)更好(地)結(jié)合,那么長(zhǎng)期持續(xù)的資金投入將變得難以為繼,既需要技術(shù)又需要商業(yè),如果你要做最好的東西,就必須要都有。
此外,對(duì)于AI從業(yè)者的自我修養(yǎng),戴文淵認(rèn)為,還需要具備韌勁與恒心,“人工智能就是一個(gè)起起伏伏的賽道,可能這兩年又被大家關(guān)注到了,甚至被吹上天,被吹上天的時(shí)候你不要覺(jué)得自己是神仙。同時(shí),被踩到地下的時(shí)候,也不要覺(jué)得自己沒(méi)有價(jià)值”。
波浪式前進(jìn)的過(guò)程中,可以肯定的是,通往AGI的道路并沒(méi)有一個(gè)標(biāo)準(zhǔn)的指路牌。
“AGI是我們所有人的理想,AGI就是我自己心目當(dāng)中的一個(gè)無(wú)窮大。”戴文淵從來(lái)不認(rèn)為AGI是一件三年、五年甚至十年就能實(shí)現(xiàn)的事,相反,他覺(jué)得,AGI是一件永遠(yuǎn)做不到,但永遠(yuǎn)都在做的事。
封面圖片來(lái)源:視覺(jué)中國(guó)
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP