每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

ChatGPT引領(lǐng)的大模型時代,小模型還有機(jī)會嗎?

每日經(jīng)濟(jì)新聞 2023-05-19 17:13:44

◎行業(yè)大模型的價值其實(shí)不在于做這個模型,而在于怎么做數(shù)據(jù)。

每經(jīng)記者 蘭素英    每經(jīng)編輯 高涵    

圖片來源:主辦方供圖

隨著ChatGPT的問世,人工智能(AI)行業(yè)進(jìn)入了全新的發(fā)展階段。大模型作為一種顛覆性技術(shù),正在吸引越來越多的頭部廠商和創(chuàng)業(yè)者投入其中。 

據(jù)花旗最新報告,保守估計生成式AI未來發(fā)展規(guī)??臻g至少達(dá)100億美元,算上對云計算的加成和推動,市場增長潛力將進(jìn)一步打開。 

有數(shù)據(jù)顯示,今年只有1%的內(nèi)容由AI生成,到2025年,這一數(shù)據(jù)將達(dá)到10%。這場狂歡背后,實(shí)際上是AI發(fā)展的一次重大飛躍,將帶來一場生產(chǎn)力的革命。

為何ChatGPT能成為AI發(fā)展的拐點(diǎn)?大模型后續(xù)的發(fā)展將呈現(xiàn)什么樣的趨勢?在大模型時代,中小模型將如何? 

在5月17日由NVIDIA初創(chuàng)加速計劃和TGO鯤鵬會在成都主辦的“‘科技+資本’雙輪驅(qū)動的ChatGPT&LLM”閉門大咖會上,稀奇資本合伙人雷強(qiáng)生告訴《每日經(jīng)濟(jì)新聞》記者,從目前來看,大模型的賽道已經(jīng)擁擠不堪,機(jī)遇更傾向于頭部廠商以及有號召力的互聯(lián)網(wǎng)大佬,而對于更多的新入局者來說,應(yīng)該在小模型和子模型層面尋找機(jī)會。 

每個行業(yè)都需要大模型嗎? 

以ChatGPT為代表的AI技術(shù)被視為未來十年最具顛覆性的技術(shù)。隨著ChatGPT的現(xiàn)象級爆紅,科技領(lǐng)域的創(chuàng)業(yè)DNA都動了。一時間,打造大模型和類ChatGPT產(chǎn)品成為最熱門的話題和趨勢。據(jù)統(tǒng)計,目前國內(nèi)已有百度、阿里巴巴、華為等超過40家企業(yè)和機(jī)構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計劃。 

為什么ChatGPT會觸發(fā)AI的拐點(diǎn)? 

亞馬遜云科技資深解決方案架構(gòu)師賀楊在會議上表示,計算能力增長、數(shù)據(jù)增長、模型復(fù)雜性是AI處于拐點(diǎn)的關(guān)鍵驅(qū)動因素。他解釋稱,“我們可以將ChatGPT理解為AI 2.0,與AI 1.0最本質(zhì)的區(qū)別是用模型驅(qū)動任務(wù),將海量的數(shù)據(jù)壓縮存儲到模型里面,用非監(jiān)督的數(shù)據(jù)進(jìn)行訓(xùn)練。這樣的大模型可以支持很多重要任務(wù),包括文本生成、歸納、提取、問答。

毫無疑問,從GPT-3所需的參數(shù)量來看,訓(xùn)練大模型需要極大的代價。單是計算和資本的投入對大多數(shù)企業(yè)來說都是難以承受之重。以O(shè)penAI舉例來說,訓(xùn)練ChatGPT除了上萬張GPU芯片的投入以外,一個月的用電量也相當(dāng)于17萬家庭一年的用電量。此外,模型的性能調(diào)優(yōu)也極其耗時,大概花了半年時間。 

在這樣的背景下,是不是所有企業(yè)或者每個細(xì)分領(lǐng)域都需要大模型呢? 

昆侖萬維CEO方漢認(rèn)為,“所有行業(yè)現(xiàn)在都要干這個事兒,這是不得不干的,行業(yè)大模型的價值其實(shí)不在于做這個模型,而在于怎么做數(shù)據(jù),這是特別苦的事情,但所有人、所有行業(yè)都應(yīng)該重復(fù)這個過程。” 

昆侖萬維CEO方漢 圖片來源:主辦方供圖

多模態(tài)發(fā)展是共識,但不會帶來人類智慧的躍升 

目前,AI正在從文本、語音、視覺等單模態(tài)智能,向著多種模態(tài)融合的通用人工智能方向發(fā)展。“基于多模態(tài)的預(yù)訓(xùn)練大模型將成為人工智能基礎(chǔ)設(shè)施”,這一觀點(diǎn)已成為業(yè)內(nèi)共識。建立統(tǒng)一的、跨場景、多任務(wù)的多模態(tài)基礎(chǔ)模型正在成為人工智能研究的一個關(guān)鍵課題。 

總部位于硅谷的向量數(shù)據(jù)庫公司Zilliz的創(chuàng)始人兼CEO星爵解釋道,大模型作為一個語言模型,第一次把所有多模態(tài)、跨模態(tài)統(tǒng)一到一個框架,它精確描述所有意圖、所有知識,把所有模態(tài)跨模態(tài)串聯(lián)起來。他估計未來兩到三年所有的模塊都會打通。 

阿里巴巴達(dá)摩院的一份報告提到,多模態(tài)預(yù)訓(xùn)練模型的發(fā)展將重塑人工智能商業(yè)模式,并為人們的生產(chǎn)生活方式帶來積極影響。對個人而言,類似CLIP(對比語言-圖像預(yù)訓(xùn)練)的多模態(tài)模型,將使更多非技術(shù)出身的人能夠表達(dá)自己的創(chuàng)造力,無需再借助工具和編程專業(yè)能力。 

對于這點(diǎn),成都普朗克科技創(chuàng)始人于芳表示無比贊同。她指出,對于喜歡畫畫和創(chuàng)造,而同時又屬于“手殘星人”的使用者來說,“多模態(tài)會賦予有創(chuàng)意、有想法的人‘’和‘眼’,為其帶來無限的創(chuàng)作體驗,讓以前的不可能變?yōu)榭赡埽@將是多模態(tài)給予這個時代的可能性。”

而對于企業(yè)來說,多模態(tài)預(yù)訓(xùn)練模型將成為企業(yè)生產(chǎn)效率提升的關(guān)鍵。商業(yè)模式上,具備大數(shù)據(jù)、算力資源和模型開發(fā)能力的科技企業(yè),將會成為模型服務(wù)的提供方,幫助企業(yè)將基礎(chǔ)模型的能力與生產(chǎn)流程融合起來,實(shí)現(xiàn)效率和成本最優(yōu)。 

雖然大模型能夠?qū)崿F(xiàn)的很多,但昆侖萬維CEO方漢在會上提到一個有趣的觀點(diǎn),即大模型并不會帶來人類智慧的提升。他表示,“人類所有的智慧都用文字記錄下來了,而現(xiàn)在所有的多模態(tài)圖像跟視頻的人類智慧含量特別少,高質(zhì)量語料幾乎用完了。”不過,從工程角度來說,他認(rèn)為,圖片跟視頻這種多模態(tài)大模型應(yīng)用上就特別有價值。 

大小模型未來幾年將“齊步走” 

實(shí)際上,在2015年之前,小模型被認(rèn)為是理解語言的“最先進(jìn)的技術(shù)”。這些小模型擅長分析型任務(wù),被用于從“預(yù)測送達(dá)時間”到“欺詐信息分類”等各類任務(wù)中。 

在大模型攪動全球之后,小模型是不是就走到“末路”了? 

圖片來源:主辦方供圖

星爵認(rèn)為,大模型跟中小模型在未來幾年會并存。從技術(shù)層面來看,他以計算機(jī)為例來解釋,ChatGPT的通用大模型是超級計算機(jī),而我們每個人攜帶的筆記本、手機(jī)等智能模型,是更小的模型,不需要很強(qiáng)的算力就能獲得很好的效果。而從業(yè)務(wù)層面分析,一定會出現(xiàn)資源配置更加高效的小模型,尤其細(xì)分領(lǐng)域的專用模型。 

谷歌近日在一年一度的開發(fā)者大會上推出最新大模型PaLM 2。這款大模型有四種參數(shù),從小到大分別為“壁虎” (Gecko),“水獺”(Otter)、“野牛”(Bison)、“獨(dú)角獸”(Unicorn)。AI產(chǎn)品經(jīng)理、技術(shù)博客Orange's AI主理人Leo此前也對《每日經(jīng)濟(jì)新聞》記者表示,這種模式非常靈活,最小模型的速度非???,可以在手機(jī)本地運(yùn)行,而GPT-4則是單一大模型,速度較慢。 

站在投資人的角度,稀奇資本合伙人雷強(qiáng)生認(rèn)為,更多的機(jī)會集中在小模型和子模型方面。 

他在論壇后接受《每日經(jīng)濟(jì)新聞》記者采訪時表示,“大模型賽道的主要玩家就是頭部廠商以及有號召力的互聯(lián)網(wǎng)大佬,例如前美團(tuán)聯(lián)合創(chuàng)始人王慧文和創(chuàng)新工場董事長兼首席執(zhí)行官李開復(fù)。

在他看來,生成式AI的定位更多是一個工具,賦能其他行業(yè)降本增效,這正是小模型的機(jī)會。大模型就像是高速公路這類基礎(chǔ)設(shè)施,其修建需要資金實(shí)力更強(qiáng)的企業(yè),但除了高速公路,社會還需要國道、省道等。 

對于小模型領(lǐng)域的發(fā)展,他指出,“這主要集中在兩個方面:一是針對垂直類行業(yè)的小模型,二是重在提升效率等的偏工具類的小模型。”

當(dāng)被問及如何選擇投資標(biāo)的時,他告訴每經(jīng)記者,主要分為兩類:聚焦場景化應(yīng)用的老玩家以及初創(chuàng)企業(yè)。“老玩家擁有大量高質(zhì)量的行業(yè)數(shù)據(jù),加上新的技術(shù)方式,就會創(chuàng)造更豐富的應(yīng)用場景以及更完善的客戶體驗,市場空間更大。”他同時強(qiáng)調(diào)了選擇優(yōu)勢產(chǎn)業(yè)的重要性,“只有優(yōu)勢的產(chǎn)業(yè)才能長出創(chuàng)新的機(jī)會。” 

封面圖片來源:視覺中國-VCG41N1303990459

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

圖片來源:主辦方供圖 隨著ChatGPT的問世,人工智能(AI)行業(yè)進(jìn)入了全新的發(fā)展階段。大模型作為一種顛覆性技術(shù),正在吸引越來越多的頭部廠商和創(chuàng)業(yè)者投入其中。 據(jù)花旗最新報告,保守估計生成式AI未來發(fā)展規(guī)??臻g至少達(dá)100億美元,算上對云計算的加成和推動,市場增長潛力將進(jìn)一步打開。 有數(shù)據(jù)顯示,今年只有1%的內(nèi)容由AI生成,到2025年,這一數(shù)據(jù)將達(dá)到10%。這場狂歡背后,實(shí)際上是AI發(fā)展的一次重大飛躍,將帶來一場生產(chǎn)力的革命。 為何ChatGPT能成為AI發(fā)展的拐點(diǎn)?大模型后續(xù)的發(fā)展將呈現(xiàn)什么樣的趨勢?在大模型時代,中小模型將如何? 在5月17日由NVIDIA初創(chuàng)加速計劃和TGO鯤鵬會在成都主辦的“‘科技+資本’雙輪驅(qū)動的ChatGPT&LLM”閉門大咖會上,稀奇資本合伙人雷強(qiáng)生告訴《每日經(jīng)濟(jì)新聞》記者,從目前來看,大模型的賽道已經(jīng)擁擠不堪,機(jī)遇更傾向于頭部廠商以及有號召力的互聯(lián)網(wǎng)大佬,而對于更多的新入局者來說,應(yīng)該在小模型和子模型層面尋找機(jī)會。 每個行業(yè)都需要大模型嗎? 以ChatGPT為代表的AI技術(shù)被視為未來十年最具顛覆性的技術(shù)。隨著ChatGPT的現(xiàn)象級爆紅,科技領(lǐng)域的創(chuàng)業(yè)DNA都動了。一時間,打造大模型和類ChatGPT產(chǎn)品成為最熱門的話題和趨勢。據(jù)統(tǒng)計,目前國內(nèi)已有百度、阿里巴巴、華為等超過40家企業(yè)和機(jī)構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計劃。 為什么ChatGPT會觸發(fā)AI的拐點(diǎn)? 亞馬遜云科技資深解決方案架構(gòu)師賀楊在會議上表示,計算能力增長、數(shù)據(jù)增長、模型復(fù)雜性是AI處于拐點(diǎn)的關(guān)鍵驅(qū)動因素。他解釋稱,“我們可以將ChatGPT理解為AI2.0,與AI1.0最本質(zhì)的區(qū)別是用模型驅(qū)動任務(wù),將海量的數(shù)據(jù)壓縮存儲到模型里面,用非監(jiān)督的數(shù)據(jù)進(jìn)行訓(xùn)練。這樣的大模型可以支持很多重要任務(wù),包括文本生成、歸納、提取、問答?!? 毫無疑問,從GPT-3所需的參數(shù)量來看,訓(xùn)練大模型需要極大的代價。單是計算和資本的投入對大多數(shù)企業(yè)來說都是難以承受之重。以O(shè)penAI舉例來說,訓(xùn)練ChatGPT除了上萬張GPU芯片的投入以外,一個月的用電量也相當(dāng)于17萬家庭一年的用電量。此外,模型的性能調(diào)優(yōu)也極其耗時,大概花了半年時間。 在這樣的背景下,是不是所有企業(yè)或者每個細(xì)分領(lǐng)域都需要大模型呢? 昆侖萬維CEO方漢認(rèn)為,“所有行業(yè)現(xiàn)在都要干這個事兒,這是不得不干的,行業(yè)大模型的價值其實(shí)不在于做這個模型,而在于怎么做數(shù)據(jù),這是特別苦的事情,但所有人、所有行業(yè)都應(yīng)該重復(fù)這個過程?!? 昆侖萬維CEO方漢圖片來源:主辦方供圖 多模態(tài)發(fā)展是共識,但不會帶來人類智慧的躍升 目前,AI正在從文本、語音、視覺等單模態(tài)智能,向著多種模態(tài)融合的通用人工智能方向發(fā)展?!盎诙嗄B(tài)的預(yù)訓(xùn)練大模型將成為人工智能基礎(chǔ)設(shè)施”,這一觀點(diǎn)已成為業(yè)內(nèi)共識。建立統(tǒng)一的、跨場景、多任務(wù)的多模態(tài)基礎(chǔ)模型正在成為人工智能研究的一個關(guān)鍵課題。 總部位于硅谷的向量數(shù)據(jù)庫公司Zilliz的創(chuàng)始人兼CEO星爵解釋道,大模型作為一個語言模型,第一次把所有多模態(tài)、跨模態(tài)統(tǒng)一到一個框架,它精確描述所有意圖、所有知識,把所有模態(tài)跨模態(tài)串聯(lián)起來。他估計未來兩到三年所有的模塊都會打通。 阿里巴巴達(dá)摩院的一份報告提到,多模態(tài)預(yù)訓(xùn)練模型的發(fā)展將重塑人工智能商業(yè)模式,并為人們的生產(chǎn)生活方式帶來積極影響。對個人而言,類似CLIP(對比語言-圖像預(yù)訓(xùn)練)的多模態(tài)模型,將使更多非技術(shù)出身的人能夠表達(dá)自己的創(chuàng)造力,無需再借助工具和編程專業(yè)能力。 對于這點(diǎn),成都普朗克科技創(chuàng)始人于芳表示無比贊同。她指出,對于喜歡畫畫和創(chuàng)造,而同時又屬于“手殘星人”的使用者來說,“多模態(tài)會賦予有創(chuàng)意、有想法的人‘手’和‘眼’,為其帶來無限的創(chuàng)作體驗,讓以前的不可能變?yōu)榭赡?,這將是多模態(tài)給予這個時代的可能性?!? 而對于企業(yè)來說,多模態(tài)預(yù)訓(xùn)練模型將成為企業(yè)生產(chǎn)效率提升的關(guān)鍵。商業(yè)模式上,具備大數(shù)據(jù)、算力資源和模型開發(fā)能力的科技企業(yè),將會成為模型服務(wù)的提供方,幫助企業(yè)將基礎(chǔ)模型的能力與生產(chǎn)流程融合起來,實(shí)現(xiàn)效率和成本最優(yōu)。 雖然大模型能夠?qū)崿F(xiàn)的很多,但昆侖萬維CEO方漢在會上提到一個有趣的觀點(diǎn),即大模型并不會帶來人類智慧的提升。他表示,“人類所有的智慧都用文字記錄下來了,而現(xiàn)在所有的多模態(tài)圖像跟視頻的人類智慧含量特別少,高質(zhì)量語料幾乎用完了。”不過,從工程角度來說,他認(rèn)為,圖片跟視頻這種多模態(tài)大模型應(yīng)用上就特別有價值。 大小模型未來幾年將“齊步走” 實(shí)際上,在2015年之前,小模型被認(rèn)為是理解語言的“最先進(jìn)的技術(shù)”。這些小模型擅長分析型任務(wù),被用于從“預(yù)測送達(dá)時間”到“欺詐信息分類”等各類任務(wù)中。 在大模型攪動全球之后,小模型是不是就走到“末路”了? 圖片來源:主辦方供圖 星爵認(rèn)為,大模型跟中小模型在未來幾年會并存。從技術(shù)層面來看,他以計算機(jī)為例來解釋,ChatGPT的通用大模型是超級計算機(jī),而我們每個人攜帶的筆記本、手機(jī)等智能模型,是更小的模型,不需要很強(qiáng)的算力就能獲得很好的效果。而從業(yè)務(wù)層面分析,一定會出現(xiàn)資源配置更加高效的小模型,尤其細(xì)分領(lǐng)域的專用模型。 谷歌近日在一年一度的開發(fā)者大會上推出最新大模型PaLM2。這款大模型有四種參數(shù),從小到大分別為“壁虎”(Gecko),“水獺”(Otter)、“野牛”(Bison)、“獨(dú)角獸”(Unicorn)。AI產(chǎn)品經(jīng)理、技術(shù)博客Orange'sAI主理人Leo此前也對《每日經(jīng)濟(jì)新聞》記者表示,這種模式非常靈活,最小模型的速度非???,可以在手機(jī)本地運(yùn)行,而GPT-4則是單一大模型,速度較慢。 站在投資人的角度,稀奇資本合伙人雷強(qiáng)生認(rèn)為,更多的機(jī)會集中在小模型和子模型方面。 他在論壇后接受《每日經(jīng)濟(jì)新聞》記者采訪時表示,“大模型賽道的主要玩家就是頭部廠商以及有號召力的互聯(lián)網(wǎng)大佬,例如前美團(tuán)聯(lián)合創(chuàng)始人王慧文和創(chuàng)新工場董事長兼首席執(zhí)行官李開復(fù)?!? 在他看來,生成式AI的定位更多是一個工具,賦能其他行業(yè)降本增效,這正是小模型的機(jī)會。大模型就像是高速公路這類基礎(chǔ)設(shè)施,其修建需要資金實(shí)力更強(qiáng)的企業(yè),但除了高速公路,社會還需要國道、省道等。 對于小模型領(lǐng)域的發(fā)展,他指出,“這主要集中在兩個方面:一是針對垂直類行業(yè)的小模型,二是重在提升效率等的偏工具類的小模型?!? 當(dāng)被問及如何選擇投資標(biāo)的時,他告訴每經(jīng)記者,主要分為兩類:聚焦場景化應(yīng)用的老玩家以及初創(chuàng)企業(yè)。“老玩家擁有大量高質(zhì)量的行業(yè)數(shù)據(jù),加上新的技術(shù)方式,就會創(chuàng)造更豐富的應(yīng)用場景以及更完善的客戶體驗,市場空間更大?!彼瑫r強(qiáng)調(diào)了選擇優(yōu)勢產(chǎn)業(yè)的重要性,“只有優(yōu)勢的產(chǎn)業(yè)才能長出創(chuàng)新的機(jī)會?!?
ChatGPT 大模型 人工智能

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人 在线 免费