每日經(jīng)濟新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

ChatGPT引領(lǐng)的大模型時代,小模型還有機會嗎?

每日經(jīng)濟新聞 2023-05-19 17:13:44

◎行業(yè)大模型的價值其實不在于做這個模型,而在于怎么做數(shù)據(jù)。

每經(jīng)記者 蘭素英    每經(jīng)編輯 高涵    

圖片來源:主辦方供圖

隨著ChatGPT的問世,人工智能(AI)行業(yè)進入了全新的發(fā)展階段。大模型作為一種顛覆性技術(shù),正在吸引越來越多的頭部廠商和創(chuàng)業(yè)者投入其中。 

據(jù)花旗最新報告,保守估計生成式AI未來發(fā)展規(guī)模空間至少達100億美元,算上對云計算的加成和推動,市場增長潛力將進一步打開。 

有數(shù)據(jù)顯示,今年只有1%的內(nèi)容由AI生成,到2025年,這一數(shù)據(jù)將達到10%。這場狂歡背后,實際上是AI發(fā)展的一次重大飛躍,將帶來一場生產(chǎn)力的革命。

為何ChatGPT能成為AI發(fā)展的拐點?大模型后續(xù)的發(fā)展將呈現(xiàn)什么樣的趨勢?在大模型時代,中小模型將如何? 

在5月17日由NVIDIA初創(chuàng)加速計劃和TGO鯤鵬會在成都主辦的“‘科技+資本’雙輪驅(qū)動的ChatGPT&LLM”閉門大咖會上,稀奇資本合伙人雷強生告訴《每日經(jīng)濟新聞》記者,從目前來看,大模型的賽道已經(jīng)擁擠不堪,機遇更傾向于頭部廠商以及有號召力的互聯(lián)網(wǎng)大佬,而對于更多的新入局者來說,應該在小模型和子模型層面尋找機會。 

每個行業(yè)都需要大模型嗎? 

以ChatGPT為代表的AI技術(shù)被視為未來十年最具顛覆性的技術(shù)。隨著ChatGPT的現(xiàn)象級爆紅,科技領(lǐng)域的創(chuàng)業(yè)DNA都動了。一時間,打造大模型和類ChatGPT產(chǎn)品成為最熱門的話題和趨勢。據(jù)統(tǒng)計,目前國內(nèi)已有百度、阿里巴巴、華為等超過40家企業(yè)和機構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計劃。 

為什么ChatGPT會觸發(fā)AI的拐點? 

亞馬遜云科技資深解決方案架構(gòu)師賀楊在會議上表示,計算能力增長、數(shù)據(jù)增長、模型復雜性是AI處于拐點的關(guān)鍵驅(qū)動因素。他解釋稱,“我們可以將ChatGPT理解為AI 2.0,與AI 1.0最本質(zhì)的區(qū)別是用模型驅(qū)動任務,將海量的數(shù)據(jù)壓縮存儲到模型里面,用非監(jiān)督的數(shù)據(jù)進行訓練。這樣的大模型可以支持很多重要任務,包括文本生成、歸納、提取、問答。

毫無疑問,從GPT-3所需的參數(shù)量來看,訓練大模型需要極大的代價。單是計算和資本的投入對大多數(shù)企業(yè)來說都是難以承受之重。以O(shè)penAI舉例來說,訓練ChatGPT除了上萬張GPU芯片的投入以外,一個月的用電量也相當于17萬家庭一年的用電量。此外,模型的性能調(diào)優(yōu)也極其耗時,大概花了半年時間。 

在這樣的背景下,是不是所有企業(yè)或者每個細分領(lǐng)域都需要大模型呢? 

昆侖萬維CEO方漢認為,“所有行業(yè)現(xiàn)在都要干這個事兒,這是不得不干的,行業(yè)大模型的價值其實不在于做這個模型,而在于怎么做數(shù)據(jù),這是特別苦的事情,但所有人、所有行業(yè)都應該重復這個過程。” 

昆侖萬維CEO方漢 圖片來源:主辦方供圖

多模態(tài)發(fā)展是共識,但不會帶來人類智慧的躍升 

目前,AI正在從文本、語音、視覺等單模態(tài)智能,向著多種模態(tài)融合的通用人工智能方向發(fā)展。“基于多模態(tài)的預訓練大模型將成為人工智能基礎(chǔ)設(shè)施”,這一觀點已成為業(yè)內(nèi)共識。建立統(tǒng)一的、跨場景、多任務的多模態(tài)基礎(chǔ)模型正在成為人工智能研究的一個關(guān)鍵課題。 

總部位于硅谷的向量數(shù)據(jù)庫公司Zilliz的創(chuàng)始人兼CEO星爵解釋道,大模型作為一個語言模型,第一次把所有多模態(tài)、跨模態(tài)統(tǒng)一到一個框架,它精確描述所有意圖、所有知識,把所有模態(tài)跨模態(tài)串聯(lián)起來。他估計未來兩到三年所有的模塊都會打通。 

阿里巴巴達摩院的一份報告提到,多模態(tài)預訓練模型的發(fā)展將重塑人工智能商業(yè)模式,并為人們的生產(chǎn)生活方式帶來積極影響。對個人而言,類似CLIP(對比語言-圖像預訓練)的多模態(tài)模型,將使更多非技術(shù)出身的人能夠表達自己的創(chuàng)造力,無需再借助工具和編程專業(yè)能力。 

對于這點,成都普朗克科技創(chuàng)始人于芳表示無比贊同。她指出,對于喜歡畫畫和創(chuàng)造,而同時又屬于“手殘星人”的使用者來說,“多模態(tài)會賦予有創(chuàng)意、有想法的人‘’和‘眼’,為其帶來無限的創(chuàng)作體驗,讓以前的不可能變?yōu)榭赡?,這將是多模態(tài)給予這個時代的可能性。”

而對于企業(yè)來說,多模態(tài)預訓練模型將成為企業(yè)生產(chǎn)效率提升的關(guān)鍵。商業(yè)模式上,具備大數(shù)據(jù)、算力資源和模型開發(fā)能力的科技企業(yè),將會成為模型服務的提供方,幫助企業(yè)將基礎(chǔ)模型的能力與生產(chǎn)流程融合起來,實現(xiàn)效率和成本最優(yōu)。 

雖然大模型能夠?qū)崿F(xiàn)的很多,但昆侖萬維CEO方漢在會上提到一個有趣的觀點,即大模型并不會帶來人類智慧的提升。他表示,“人類所有的智慧都用文字記錄下來了,而現(xiàn)在所有的多模態(tài)圖像跟視頻的人類智慧含量特別少,高質(zhì)量語料幾乎用完了。”不過,從工程角度來說,他認為,圖片跟視頻這種多模態(tài)大模型應用上就特別有價值。 

大小模型未來幾年將“齊步走” 

實際上,在2015年之前,小模型被認為是理解語言的“最先進的技術(shù)”。這些小模型擅長分析型任務,被用于從“預測送達時間”到“欺詐信息分類”等各類任務中。 

在大模型攪動全球之后,小模型是不是就走到“末路”了? 

圖片來源:主辦方供圖

星爵認為,大模型跟中小模型在未來幾年會并存。從技術(shù)層面來看,他以計算機為例來解釋,ChatGPT的通用大模型是超級計算機,而我們每個人攜帶的筆記本、手機等智能模型,是更小的模型,不需要很強的算力就能獲得很好的效果。而從業(yè)務層面分析,一定會出現(xiàn)資源配置更加高效的小模型,尤其細分領(lǐng)域的專用模型。 

谷歌近日在一年一度的開發(fā)者大會上推出最新大模型PaLM 2。這款大模型有四種參數(shù),從小到大分別為“壁虎” (Gecko),“水獺”(Otter)、“野牛”(Bison)、“獨角獸”(Unicorn)。AI產(chǎn)品經(jīng)理、技術(shù)博客Orange's AI主理人Leo此前也對《每日經(jīng)濟新聞》記者表示,這種模式非常靈活,最小模型的速度非??欤梢栽谑謾C本地運行,而GPT-4則是單一大模型,速度較慢。 

站在投資人的角度,稀奇資本合伙人雷強生認為,更多的機會集中在小模型和子模型方面。 

他在論壇后接受《每日經(jīng)濟新聞》記者采訪時表示,“大模型賽道的主要玩家就是頭部廠商以及有號召力的互聯(lián)網(wǎng)大佬,例如前美團聯(lián)合創(chuàng)始人王慧文和創(chuàng)新工場董事長兼首席執(zhí)行官李開復。

在他看來,生成式AI的定位更多是一個工具,賦能其他行業(yè)降本增效,這正是小模型的機會。大模型就像是高速公路這類基礎(chǔ)設(shè)施,其修建需要資金實力更強的企業(yè),但除了高速公路,社會還需要國道、省道等。 

對于小模型領(lǐng)域的發(fā)展,他指出,“這主要集中在兩個方面:一是針對垂直類行業(yè)的小模型,二是重在提升效率等的偏工具類的小模型。”

當被問及如何選擇投資標的時,他告訴每經(jīng)記者,主要分為兩類:聚焦場景化應用的老玩家以及初創(chuàng)企業(yè)。“老玩家擁有大量高質(zhì)量的行業(yè)數(shù)據(jù),加上新的技術(shù)方式,就會創(chuàng)造更豐富的應用場景以及更完善的客戶體驗,市場空間更大。”他同時強調(diào)了選擇優(yōu)勢產(chǎn)業(yè)的重要性,“只有優(yōu)勢的產(chǎn)業(yè)才能長出創(chuàng)新的機會。” 

封面圖片來源:視覺中國-VCG41N1303990459

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

圖片來源:主辦方供圖 隨著ChatGPT的問世,人工智能(AI)行業(yè)進入了全新的發(fā)展階段。大模型作為一種顛覆性技術(shù),正在吸引越來越多的頭部廠商和創(chuàng)業(yè)者投入其中。 據(jù)花旗最新報告,保守估計生成式AI未來發(fā)展規(guī)模空間至少達100億美元,算上對云計算的加成和推動,市場增長潛力將進一步打開。 有數(shù)據(jù)顯示,今年只有1%的內(nèi)容由AI生成,到2025年,這一數(shù)據(jù)將達到10%。這場狂歡背后,實際上是AI發(fā)展的一次重大飛躍,將帶來一場生產(chǎn)力的革命。 為何ChatGPT能成為AI發(fā)展的拐點?大模型后續(xù)的發(fā)展將呈現(xiàn)什么樣的趨勢?在大模型時代,中小模型將如何? 在5月17日由NVIDIA初創(chuàng)加速計劃和TGO鯤鵬會在成都主辦的“‘科技+資本’雙輪驅(qū)動的ChatGPT&LLM”閉門大咖會上,稀奇資本合伙人雷強生告訴《每日經(jīng)濟新聞》記者,從目前來看,大模型的賽道已經(jīng)擁擠不堪,機遇更傾向于頭部廠商以及有號召力的互聯(lián)網(wǎng)大佬,而對于更多的新入局者來說,應該在小模型和子模型層面尋找機會。 每個行業(yè)都需要大模型嗎? 以ChatGPT為代表的AI技術(shù)被視為未來十年最具顛覆性的技術(shù)。隨著ChatGPT的現(xiàn)象級爆紅,科技領(lǐng)域的創(chuàng)業(yè)DNA都動了。一時間,打造大模型和類ChatGPT產(chǎn)品成為最熱門的話題和趨勢。據(jù)統(tǒng)計,目前國內(nèi)已有百度、阿里巴巴、華為等超過40家企業(yè)和機構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計劃。 為什么ChatGPT會觸發(fā)AI的拐點? 亞馬遜云科技資深解決方案架構(gòu)師賀楊在會議上表示,計算能力增長、數(shù)據(jù)增長、模型復雜性是AI處于拐點的關(guān)鍵驅(qū)動因素。他解釋稱,“我們可以將ChatGPT理解為AI2.0,與AI1.0最本質(zhì)的區(qū)別是用模型驅(qū)動任務,將海量的數(shù)據(jù)壓縮存儲到模型里面,用非監(jiān)督的數(shù)據(jù)進行訓練。這樣的大模型可以支持很多重要任務,包括文本生成、歸納、提取、問答?!? 毫無疑問,從GPT-3所需的參數(shù)量來看,訓練大模型需要極大的代價。單是計算和資本的投入對大多數(shù)企業(yè)來說都是難以承受之重。以O(shè)penAI舉例來說,訓練ChatGPT除了上萬張GPU芯片的投入以外,一個月的用電量也相當于17萬家庭一年的用電量。此外,模型的性能調(diào)優(yōu)也極其耗時,大概花了半年時間。 在這樣的背景下,是不是所有企業(yè)或者每個細分領(lǐng)域都需要大模型呢? 昆侖萬維CEO方漢認為,“所有行業(yè)現(xiàn)在都要干這個事兒,這是不得不干的,行業(yè)大模型的價值其實不在于做這個模型,而在于怎么做數(shù)據(jù),這是特別苦的事情,但所有人、所有行業(yè)都應該重復這個過程?!? 昆侖萬維CEO方漢圖片來源:主辦方供圖 多模態(tài)發(fā)展是共識,但不會帶來人類智慧的躍升 目前,AI正在從文本、語音、視覺等單模態(tài)智能,向著多種模態(tài)融合的通用人工智能方向發(fā)展?!盎诙嗄B(tài)的預訓練大模型將成為人工智能基礎(chǔ)設(shè)施”,這一觀點已成為業(yè)內(nèi)共識。建立統(tǒng)一的、跨場景、多任務的多模態(tài)基礎(chǔ)模型正在成為人工智能研究的一個關(guān)鍵課題。 總部位于硅谷的向量數(shù)據(jù)庫公司Zilliz的創(chuàng)始人兼CEO星爵解釋道,大模型作為一個語言模型,第一次把所有多模態(tài)、跨模態(tài)統(tǒng)一到一個框架,它精確描述所有意圖、所有知識,把所有模態(tài)跨模態(tài)串聯(lián)起來。他估計未來兩到三年所有的模塊都會打通。 阿里巴巴達摩院的一份報告提到,多模態(tài)預訓練模型的發(fā)展將重塑人工智能商業(yè)模式,并為人們的生產(chǎn)生活方式帶來積極影響。對個人而言,類似CLIP(對比語言-圖像預訓練)的多模態(tài)模型,將使更多非技術(shù)出身的人能夠表達自己的創(chuàng)造力,無需再借助工具和編程專業(yè)能力。 對于這點,成都普朗克科技創(chuàng)始人于芳表示無比贊同。她指出,對于喜歡畫畫和創(chuàng)造,而同時又屬于“手殘星人”的使用者來說,“多模態(tài)會賦予有創(chuàng)意、有想法的人‘手’和‘眼’,為其帶來無限的創(chuàng)作體驗,讓以前的不可能變?yōu)榭赡?,這將是多模態(tài)給予這個時代的可能性。” 而對于企業(yè)來說,多模態(tài)預訓練模型將成為企業(yè)生產(chǎn)效率提升的關(guān)鍵。商業(yè)模式上,具備大數(shù)據(jù)、算力資源和模型開發(fā)能力的科技企業(yè),將會成為模型服務的提供方,幫助企業(yè)將基礎(chǔ)模型的能力與生產(chǎn)流程融合起來,實現(xiàn)效率和成本最優(yōu)。 雖然大模型能夠?qū)崿F(xiàn)的很多,但昆侖萬維CEO方漢在會上提到一個有趣的觀點,即大模型并不會帶來人類智慧的提升。他表示,“人類所有的智慧都用文字記錄下來了,而現(xiàn)在所有的多模態(tài)圖像跟視頻的人類智慧含量特別少,高質(zhì)量語料幾乎用完了?!辈贿^,從工程角度來說,他認為,圖片跟視頻這種多模態(tài)大模型應用上就特別有價值。 大小模型未來幾年將“齊步走” 實際上,在2015年之前,小模型被認為是理解語言的“最先進的技術(shù)”。這些小模型擅長分析型任務,被用于從“預測送達時間”到“欺詐信息分類”等各類任務中。 在大模型攪動全球之后,小模型是不是就走到“末路”了? 圖片來源:主辦方供圖 星爵認為,大模型跟中小模型在未來幾年會并存。從技術(shù)層面來看,他以計算機為例來解釋,ChatGPT的通用大模型是超級計算機,而我們每個人攜帶的筆記本、手機等智能模型,是更小的模型,不需要很強的算力就能獲得很好的效果。而從業(yè)務層面分析,一定會出現(xiàn)資源配置更加高效的小模型,尤其細分領(lǐng)域的專用模型。 谷歌近日在一年一度的開發(fā)者大會上推出最新大模型PaLM2。這款大模型有四種參數(shù),從小到大分別為“壁虎”(Gecko),“水獺”(Otter)、“野?!保˙ison)、“獨角獸”(Unicorn)。AI產(chǎn)品經(jīng)理、技術(shù)博客Orange'sAI主理人Leo此前也對《每日經(jīng)濟新聞》記者表示,這種模式非常靈活,最小模型的速度非??欤梢栽谑謾C本地運行,而GPT-4則是單一大模型,速度較慢。 站在投資人的角度,稀奇資本合伙人雷強生認為,更多的機會集中在小模型和子模型方面。 他在論壇后接受《每日經(jīng)濟新聞》記者采訪時表示,“大模型賽道的主要玩家就是頭部廠商以及有號召力的互聯(lián)網(wǎng)大佬,例如前美團聯(lián)合創(chuàng)始人王慧文和創(chuàng)新工場董事長兼首席執(zhí)行官李開復。” 在他看來,生成式AI的定位更多是一個工具,賦能其他行業(yè)降本增效,這正是小模型的機會。大模型就像是高速公路這類基礎(chǔ)設(shè)施,其修建需要資金實力更強的企業(yè),但除了高速公路,社會還需要國道、省道等。 對于小模型領(lǐng)域的發(fā)展,他指出,“這主要集中在兩個方面:一是針對垂直類行業(yè)的小模型,二是重在提升效率等的偏工具類的小模型?!? 當被問及如何選擇投資標的時,他告訴每經(jīng)記者,主要分為兩類:聚焦場景化應用的老玩家以及初創(chuàng)企業(yè)?!袄贤婕覔碛写罅扛哔|(zhì)量的行業(yè)數(shù)據(jù),加上新的技術(shù)方式,就會創(chuàng)造更豐富的應用場景以及更完善的客戶體驗,市場空間更大?!彼瑫r強調(diào)了選擇優(yōu)勢產(chǎn)業(yè)的重要性,“只有優(yōu)勢的產(chǎn)業(yè)才能長出創(chuàng)新的機會?!?
ChatGPT 大模型 人工智能

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人 在线 免费