每日經(jīng)濟(jì)新聞 2023-07-13 22:25:44
◎產(chǎn)業(yè)大模型是通用域大模型的進(jìn)階版。其同時(shí)需要通用大模型的常識(shí)能力,和各個(gè)產(chǎn)業(yè)側(cè)的know-how。京東云已經(jīng)基于內(nèi)部實(shí)踐構(gòu)建了通用大模型;到今年年底這段時(shí)間,京東將經(jīng)由高復(fù)雜場(chǎng)景大規(guī)模訓(xùn)練,迭代出產(chǎn)業(yè)服務(wù);預(yù)計(jì)在2024年初,會(huì)將大模型能力向外部嚴(yán)肅商業(yè)場(chǎng)景開放。
每經(jīng)記者 王郁彪 每經(jīng)編輯 劉雪梅
預(yù)熱多時(shí),京東大模型“這盤菜”終于端上桌。
7月13日,2023京東全球科技探索者大會(huì)上,京東千億級(jí)參數(shù)言犀大模型正式亮相。中國(guó)大模型已“狂飆”半年,京東如今“交卷”顯得姍姍來遲。
不過拉長(zhǎng)時(shí)間軸,從2021年十億級(jí)大模型“K-PLUG”,到2022年百億級(jí)大模型Vega,京東在大模型上一直在不間斷地探索與嘗試。
“京東不會(huì)把一盤色香味不俱全的菜端上桌。”京東集團(tuán)CEO許冉在現(xiàn)場(chǎng)如此回應(yīng)。因?yàn)槊嫦虍a(chǎn)業(yè),是京東大模型區(qū)別于市面絕大多數(shù)競(jìng)品的“特色選項(xiàng)”。
這一方面源于部分產(chǎn)業(yè)數(shù)據(jù)的補(bǔ)足?!睹咳战?jīng)濟(jì)新聞》記者現(xiàn)場(chǎng)注意到,京東言犀大模型有70%的數(shù)據(jù)來自通用領(lǐng)域,剩下的30%則來自不同產(chǎn)業(yè)板塊,如,13.6%來自零售,6.7%來自健康等。
另一方面,一個(gè)編造得并不準(zhǔn)確的GPT式回答,可能并不會(huì)給使用者造成多大影響,但在嚴(yán)肅的商業(yè)場(chǎng)景下,一個(gè)小數(shù)點(diǎn)的偏差,恐會(huì)造就無法挽回的損失。所以,面向產(chǎn)業(yè)的大模型,京東認(rèn)為需要“小火慢燉”。
但國(guó)產(chǎn)大模型的爭(zhēng)端,更是在牌桌之上。上半年,各家入場(chǎng),多方角力,但下半年,商業(yè)場(chǎng)景的落地與規(guī)模應(yīng)用,很快會(huì)被提上日程。新一代人工智能的多面性與先進(jìn)性,讓長(zhǎng)期All in變得篤定,但最終仍然需要市場(chǎng)“投票”。
“這幾個(gè)月,一直有人問我,京東怎么還不發(fā)大模型。顯得比我都急迫。”京東集團(tuán)技術(shù)委員會(huì)主席、京東云事業(yè)部總裁曹鵬現(xiàn)場(chǎng)笑稱,“雖然對(duì)話類通用大模型產(chǎn)品時(shí)下很熱,但我認(rèn)為這不應(yīng)該是全部,大模型也不應(yīng)該只是拿來聊天、寫詩(shī)、作畫的玩具。”
中國(guó)大模型“狂飆”半年,好像所有人都以一種“時(shí)不我待”的姿態(tài)沖了進(jìn)來??萍疾俊吨袊?guó)人工智能大模型地圖研究報(bào)告》顯示,截至今年5月,中國(guó)研發(fā)的10億參數(shù)規(guī)模以上大模型已發(fā)布79個(gè),位居全球第二。在7月上旬剛剛結(jié)束的2023世界人工智能大會(huì)上,據(jù)不完全統(tǒng)計(jì),有24款大模型新品在大會(huì)上發(fā)布或宣布即將發(fā)布。
“百模大戰(zhàn)”開啟序章。從模式角度而言,在如今國(guó)內(nèi)大模型的語境下,對(duì)“通用大模型”和聚焦各細(xì)分應(yīng)用場(chǎng)景的“垂類大模型”的爭(zhēng)論不斷,兩方也各有支持者,但究竟哪條路更易跑通,更易搶占先機(jī),仍無定論。
但從技術(shù)角度出發(fā),絕大部分企業(yè)均為基于transformer做大規(guī)模預(yù)訓(xùn)練,并不斷地進(jìn)行調(diào)優(yōu)。“我相信國(guó)內(nèi)的大模型在中文方向?qū)⒑芸斐絿?guó)外的對(duì)話產(chǎn)品。”京東探索研究院院長(zhǎng)、京東科技智能服務(wù)與產(chǎn)品部總裁何曉冬如此預(yù)測(cè)。
但他同時(shí)認(rèn)為,產(chǎn)業(yè)大模型是通用域大模型的進(jìn)階版。其同時(shí)需要通用大模型的常識(shí)能力,和各個(gè)產(chǎn)業(yè)側(cè)的know-how。
這幾乎是兩方的深度結(jié)合,和更具廣度的覆蓋。這當(dāng)然是最具價(jià)值,也是難度最大的一條路。
《每日經(jīng)濟(jì)新聞》記者現(xiàn)場(chǎng)注意到,發(fā)布大模型的同時(shí),京東也更新了后續(xù)大模型的進(jìn)程。目前,京東云已經(jīng)基于內(nèi)部實(shí)踐構(gòu)建了通用大模型;到今年年底這段時(shí)間,京東將經(jīng)由高復(fù)雜場(chǎng)景大規(guī)模訓(xùn)練,迭代出產(chǎn)業(yè)服務(wù);預(yù)計(jì)在2024年初,會(huì)將大模型能力向外部嚴(yán)肅商業(yè)場(chǎng)景開放。目前,京東已經(jīng)走到了第二步。
何曉冬公布京東言犀大模型三步走進(jìn)程。圖片來源:企業(yè)供圖
“某種意義上,我們的大模型相當(dāng)于既做了通識(shí)教育,又讀了四年專業(yè)性的本科教育”,何曉冬如此比喻。
雖然大模型的難點(diǎn),會(huì)慢慢從技術(shù)突破轉(zhuǎn)向產(chǎn)業(yè)縱深的突圍,但若想真正深入千行百業(yè),“本科學(xué)歷”或許還只是入場(chǎng)券。
“所有行業(yè)都值得用大模型再做一次”雖已成為行業(yè)共識(shí),但背后必然需要技術(shù)平臺(tái)與產(chǎn)業(yè)側(cè)的多方協(xié)同。而協(xié)同多方,才是最難的事。
釋出大模型的同時(shí),京東官宣“言犀AI開發(fā)計(jì)算平臺(tái)”,支持一站式大模型開發(fā)。這是京東給出的又一種思路。言犀AI開發(fā)計(jì)算平臺(tái)除支持言犀大模型外,同時(shí)還支持其他主流開源模型。
記者了解到,在言犀AI開發(fā)計(jì)算平臺(tái)上,匯有京東零售、物流、健康、金融等行業(yè)知識(shí),部署100多種訓(xùn)練和推理優(yōu)化工具,結(jié)合低代碼應(yīng)用平臺(tái),可以提供數(shù)據(jù)建設(shè)、模型應(yīng)用等服務(wù)。
“1到2個(gè)算法人員在此環(huán)境中,不到一周就能完成數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練和模型部署,造一個(gè)垂直大模型出來。”曹鵬對(duì)比稱,“此前這一工作,需10余人的科學(xué)家團(tuán)隊(duì)協(xié)作完成。”何曉冬則補(bǔ)充說,京東的數(shù)據(jù)是“鮮活的”,京東每年產(chǎn)生數(shù)百億的交互數(shù)據(jù),這保證了模型的持續(xù)迭代和優(yōu)化。
產(chǎn)業(yè)大模型的B面,則需要更嚴(yán)謹(jǐn)?shù)妮斎肱c輸出,精準(zhǔn)是最為重要的追求之一。公開數(shù)據(jù)顯示,目前通用大模型85%左右的準(zhǔn)確率,之于普通用戶已經(jīng)足夠,但在嚴(yán)肅的商業(yè)場(chǎng)景下,失之毫厘,差之千里。
一個(gè)編造的GPT式回答可能只會(huì)讓使用者付之一笑,但產(chǎn)業(yè)大模型的數(shù)據(jù)偏頗,需要更嚴(yán)肅的審定。
何曉冬此前曾舉例稱,“一個(gè)大模型回答143開平方,給出的答案是11.5,但實(shí)際應(yīng)約為11.96,如果在嚴(yán)肅商業(yè)場(chǎng)景的應(yīng)用中,這個(gè)細(xì)微偏差的答案,將會(huì)帶來無法計(jì)量的損失。”他認(rèn)為,大模型走向產(chǎn)業(yè)的難題是知識(shí)深度、內(nèi)容準(zhǔn)度、模型迭代、安全可控等。
大模型的下半場(chǎng),印證著新的AI三要素:場(chǎng)景、產(chǎn)品和新型算力。從ChatGPT的“引爆”,到“百模齊放”,再到“通用模式”與“垂直模式”之爭(zhēng),新一代人工智能的發(fā)展隨著浪潮波動(dòng)起伏,但他終會(huì)向各行各業(yè)滲透去。
一場(chǎng)嚴(yán)肅的技術(shù)革命,需要真實(shí)的應(yīng)用與落地。需要時(shí)間、投入,需要數(shù)據(jù)在場(chǎng)景中歷練。大模型下半場(chǎng)之爭(zhēng),當(dāng)然需要一盤“色香味俱全”的菜肴上桌,但一如細(xì)微偏差造就完全不同的答案,新的選擇也將在兩難中,最終揭曉。
封面圖片來源:企業(yè)供圖
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP