每日經(jīng)濟(jì)新聞 2023-12-20 16:05:40
◎王小川認(rèn)為,通用大模型可以在大部分場(chǎng)景下替代行業(yè)大模型,通用大模型+搜索增強(qiáng)可以解決99%企業(yè)知識(shí)庫(kù)的定制化需求。
◎在應(yīng)用領(lǐng)域,王小川認(rèn)為,今年是中國(guó)大模型發(fā)展的元年,明年中國(guó)各家公司都會(huì)有相應(yīng)的成績(jī)出來(lái)。
每經(jīng)記者 可楊 每經(jīng)編輯 梁梟
大模型熱潮一年,落地應(yīng)用成為行業(yè)關(guān)注的焦點(diǎn)。
12月19日,百川智能宣布開(kāi)放基于搜索增強(qiáng)的Baichuan2-Turbo系列API,包含Baichuan2-Turbo-192K及Baichuan2-Turbo。在支持192K超長(zhǎng)上下文窗口的基礎(chǔ)上,還增加了搜索增強(qiáng)知識(shí)庫(kù)的能力。即日起,API(即應(yīng)用程序接口)用戶可上傳文本資料來(lái)創(chuàng)建自身專屬知識(shí)庫(kù),從而根據(jù)自身業(yè)務(wù)需求打造更完整、高效的智能解決方案。
這是百川智能在商業(yè)化層面的一步探索。談及大模型的落地應(yīng)用,百川智能創(chuàng)始人、CEO王小川在交流會(huì)上表示:“光靠模型本身做得再大都是不夠的,大模型+搜索才能構(gòu)成完整的技術(shù)棧。”
“大模型走向?qū)嵱茫己粲跄P吐涞?,在今天,尤其從?guó)內(nèi)來(lái)看,搜索增強(qiáng)是大模型走向?qū)嵱玫牡谝徊?,甚至是最關(guān)鍵的一步。沒(méi)有搜索增強(qiáng)的大模型在企業(yè)里是沒(méi)法落地的。”王小川認(rèn)為。
盡管大模型是劃時(shí)代的技術(shù)突破,但現(xiàn)階段大模型并不完美,幻覺(jué)、時(shí)效性差、缺乏專業(yè)領(lǐng)域知識(shí)等問(wèn)題,是其落地千行百業(yè)必須面對(duì)的挑戰(zhàn)。
王小川表示,眾所周知,在大型模型研究領(lǐng)域,存在幾個(gè)關(guān)鍵詞。首先是大型模型的幻覺(jué),大家通過(guò)更大的模型去減少幻覺(jué),成本會(huì)隨之上升,畢竟幻覺(jué)問(wèn)題沒(méi)有止境。其次是大模型本身的時(shí)效性較差,大模型是靜態(tài)的知識(shí)庫(kù),需要不斷升級(jí)。尤其是在垂直領(lǐng)域的實(shí)際商業(yè)應(yīng)用中,需要解決企業(yè)自身的數(shù)據(jù)、公開(kāi)網(wǎng)絡(luò)數(shù)據(jù)以及垂直領(lǐng)域的數(shù)據(jù)三大問(wèn)題。
對(duì)于解決這些問(wèn)題,王小川認(rèn)為,光靠模型本身做得再大都是不夠的,大模型+搜索才能構(gòu)成完整的技術(shù)棧。“當(dāng)技術(shù)增強(qiáng),我們能實(shí)現(xiàn)互聯(lián)網(wǎng)與垂直領(lǐng)域知識(shí)、全網(wǎng)知識(shí)的全線鏈接,這個(gè)完整的技術(shù)棧有利于我們讓大模型真正去落地應(yīng)用。”
“我們知道做模型的時(shí)候,不代表每次效果都會(huì)提升,搞不好(會(huì))下降,是不穩(wěn)定的事情。即便大模型公司也需要非常多的經(jīng)驗(yàn)積累,才能提升它的效果。”王小川認(rèn)為,行業(yè)大模型大路徑,不僅人才、算力要求高,穩(wěn)定性、可靠性都會(huì)低很多,與此同時(shí),一旦數(shù)據(jù)或者算法更新,企業(yè)就得重訓(xùn)一次。“因此用行業(yè)大模型解決企業(yè)應(yīng)用,概念大家聽(tīng)著很開(kāi)心,但今天并沒(méi)有良好實(shí)踐,面臨很多問(wèn)題。”
王小川認(rèn)為,通用大模型可以在大部分場(chǎng)景下替代行業(yè)大模型,通用大模型+搜索增強(qiáng)可以解決99%企業(yè)知識(shí)庫(kù)的定制化需求。
王小川表示,更大的內(nèi)存、更強(qiáng)的處理器依然不能解決幻覺(jué)問(wèn)題,也不能解決外部知識(shí)引入和時(shí)效性的問(wèn)題。“我們認(rèn)為需要通過(guò)搜索增強(qiáng)把互聯(lián)網(wǎng)實(shí)時(shí)的信息和企業(yè)完整的知識(shí)庫(kù),像硬盤(pán)一樣裝進(jìn)去。讓大模型外掛這樣一個(gè)外部知識(shí),外掛外部硬盤(pán),這是搜索增強(qiáng)做到的工作。有了搜索增強(qiáng)以后,大模型加上外掛硬盤(pán)的即插即用,使得在絕大多數(shù)領(lǐng)域里面模型變得更加實(shí)用。”
“這次跟上次不一樣,上一波由于模型能力,主要是圖像處理,因?yàn)椴粔蛲ㄓ?,不夠通用帶?lái)兩個(gè)問(wèn)題:首先是大家都擠在一個(gè)賽道里,都去做安防,不能賦能千行百業(yè),也不能進(jìn)一步降低企業(yè)的使用成本。其次是賽道很窄,每個(gè)項(xiàng)目都很重,今天美國(guó)證明大模型在很多行業(yè)都可以做,而且實(shí)施成本會(huì)比原來(lái)低很多,所以這一波我覺(jué)得是可行的。”談及這一年的大模型熱潮與此前的區(qū)別,王小川表示。
回溯今年以來(lái)的大模型競(jìng)速,王小川將其分為了三個(gè)不同階段。第一個(gè)是恐慌期,“OpenAI有了之后看中國(guó)公司還不行,數(shù)據(jù)飛輪美國(guó)先跑起來(lái),是不是通用人工智能要來(lái)了,大家有這個(gè)探討。”第二階段,大家開(kāi)始火熱地工作,所有人的關(guān)注都在這里;第三階段,技術(shù)迭代加速,“我們的技術(shù)人員每天都要跟進(jìn)最新的東西,要把自己(的成果)不斷迭代不斷改進(jìn),行業(yè)中的發(fā)展速度其實(shí)超出外界媒體和資本圈的看法,目前還是在快速迭代。”
而在應(yīng)用領(lǐng)域,王小川認(rèn)為,今年是中國(guó)大模型發(fā)展的元年,明年中國(guó)各家公司都會(huì)有相應(yīng)的成績(jī)出來(lái)。“今年確實(shí)大家太需要把精力放在模型本身,應(yīng)用在今天我認(rèn)為還是在初期狀態(tài),這會(huì)兒談應(yīng)用早一點(diǎn),明年會(huì)差不多。”
封面圖片來(lái)源:視覺(jué)中國(guó)-VCG41N1462568496
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP