每日經(jīng)濟新聞 2023-02-20 20:43:31
每經(jīng)記者 李沛沛 姚亞楠 每經(jīng)編輯 彭水萍
2023年開年,ChatGPT迅速火遍全球,短短兩個月時間月活突破一億,成為被載入史冊的應用之一。
ChatGPT的大火引發(fā)了全球科技巨頭的一場“軍備競賽”,國內(nèi)的“中國版ChatGPT”爭奪戰(zhàn)也是一觸即發(fā)。
在國內(nèi)眾多大廠中,百度是最早做出明確表態(tài)的公司之一,2月初就正式宣布將在3月上線百度版ChatGPT“文心一言”,打響第一槍。
接下來,華為、騰訊、阿里、京東云也都公布了自身在相關(guān)領(lǐng)域的布局情況,還有消息傳出稱字節(jié)跳動的人工智能實驗室(AI Lab)有開展類似ChatGPT和AIGC的相關(guān)研發(fā)。
圖片來源:視覺中國-VCG41N1188747468
作為長期關(guān)注AI賽道、走在第一線的VC/PE,對于AI大模型和“中國版ChatGPT”也保持著高度關(guān)注。我國什么時候才能擁有自己的“超級大腦”AI大模型?需要在哪些方面實現(xiàn)突破?目前面臨的挑戰(zhàn)又有哪些?
針對這些行業(yè)高度關(guān)注的熱門話題,《每日經(jīng)濟新聞》記者采訪了多位一級市場知名投資人。
“未來國內(nèi)一定會有自己的AI大模型,并且也一定會誕生自己的ChatGPT。”在談到打造AI大模型和“中國版ChatGPT”是否現(xiàn)實時,多位投資人都對《每日經(jīng)濟新聞》記者做出了這樣的判斷。
創(chuàng)世伙伴資本合伙人聶冬辰進一步解釋稱,中國擁有龐大的數(shù)據(jù),較強的模型開發(fā)和算法優(yōu)化能力,大量優(yōu)秀的AI工程師,具備打造中國版ChatGPT的條件,“當然,這是一件長期的事,涉及數(shù)據(jù)的收集清洗、算法的設計優(yōu)化等多個環(huán)節(jié),我們看到已經(jīng)有幾家公司在努力去做,但目前都處于比較早期的階段。”
對于中國能否做出自己的AI大模型,CMC資本董事總經(jīng)理易然也表達了自己的樂觀:“這完全是一個資源和時間的問題,而且不會差太遠,我們之前和一些模型層的創(chuàng)業(yè)者、學者都有過交流,從技術(shù)的了解程度和人才儲備來說,我們其實并不差。此外,現(xiàn)在關(guān)于模型構(gòu)建方面的學術(shù)交流也很開放和活躍,我們可以做一些參考。”
而在線性資本投資總監(jiān)白則人看來,大模型這塊已經(jīng)不是什么秘密,因為雖然OpenAI的代碼沒有開源,但是整個的構(gòu)建思路已經(jīng)通過論文的形式發(fā)出來了,大方向上已經(jīng)明確,只是在模型構(gòu)建和效果優(yōu)化方面的探索需要花費大量時間,有大量工程化問題要解決,并且訓練成本也非常高。
“我覺得市場還需要多一些耐心。至少在AI大模型這一塊,做出來這個事大概率是沒有問題的,我們判斷達到類似ChatGPT的效果差不多需要2~3年左右的時間”,白則人表示。
啟明創(chuàng)投合伙人周志峰則表示,他非常喜歡北京智源人工智能研究院理事長張宏江所說的一個比喻:過去的AI更多的是“大煉模型“,也就是說每家科技公司都是各自獨立研發(fā)專用小模型;今天這一代的AI技術(shù),叫做“煉大模型”,底座模型是由某些特定的機構(gòu)研發(fā)出超大規(guī)模的通用模型,“這個模型不再是針對某一個專門應用開發(fā)的,它的訓練數(shù)據(jù)是互聯(lián)網(wǎng)上能夠看到的所有數(shù)據(jù),數(shù)據(jù)也不需要做特別的標注,訓練也不需要監(jiān)督,做出來的是通用人工智能能力,然后第三方基于底座模型,針對千萬個應用場景去開發(fā)軟件”。
他指出,從“大煉模型”到“煉大模型”的范式轉(zhuǎn)變,對AI未來十年、二十年的發(fā)展有重大意義。
國內(nèi)巨頭已經(jīng)紛紛入局,那么要做出ChatGPT這樣的現(xiàn)象級產(chǎn)品,目前還有哪些現(xiàn)實的挑戰(zhàn)擺在眼前呢?
易然坦言,國內(nèi)的公司此前在這個領(lǐng)域已經(jīng)有一些探索了,如果要達到類似ChatGPT的效果,還需要更多資源和時間的投入。“當然像芯片等方面可能會面臨一些阻礙,但是應該也會有一些其他的解決方法。”他表示,未來會繼續(xù)關(guān)注模型層的演變,尤其是開源對模型層帶來的影響,科技大廠在訓練上取得了一些初步優(yōu)勢后可能通過開源的方式去降維打擊。創(chuàng)業(yè)公司如何更好地利用開源的模型,能否構(gòu)建出屬于自己垂直領(lǐng)域、更精細化的小模型也值得期待。
在白則人看來,要做出國內(nèi)自己的AI大模型,最關(guān)鍵的要素是要有足夠的算力和模型工程化的人才。
“算力這塊可能會面臨卡脖子的問題,而且除了硬件方面,可能還有一些比如說計算框架層面這些軟件層面的問題需要去解決。當然我們也看到,中國的GPU近年來也在快速發(fā)展中,所以我覺得國內(nèi)的企業(yè)還是有實力可以去做的。”
聶冬辰也向《每日經(jīng)濟新聞》記者分析稱,構(gòu)建中國的AI大模型需要幾方面條件更加成熟:首先是底層技術(shù)能力,在模型構(gòu)建和訓練方面要有持續(xù)大量投入,形成自己的中文語言大模型。其次,在數(shù)據(jù)方面,要有足夠體量的數(shù)據(jù)灌進來,對數(shù)據(jù)的收集、整理、清洗是一個非常龐大且耗時耗力的過程,需要有公司踏踏實實地能把這件事情做成。此外,整個市場,無論是科技大廠、創(chuàng)業(yè)公司還是投資人,都需要有足夠的耐心,不投機、不跟風。“如果我們真的能沉下心來,十年如一日地朝著自己的AI大模型方向去訓練演進,肯定能做出來”。
而在談到關(guān)于中國在生成式AI和底座大模型的挑戰(zhàn)時,周志峰指出,首先要面臨的就是算力問題。由于算力成本非常高,怎么用國產(chǎn)的AI芯片進行替代并降低成本,國產(chǎn)的AI芯片是不是能夠、什么時候能夠滿足大規(guī)模集群的算力、互聯(lián)帶寬、算法適配和協(xié)同的需求,都值得去觀察。
其次,過去一周很多人說國內(nèi)的科技大廠和創(chuàng)業(yè)公司推出的大模型與ChatGPT是有代際差別的,我們落后了至少一代。在看Open AI的發(fā)展時會發(fā)現(xiàn),ChatGPT也好、GPT-3也好,是需要很長時間研發(fā)積累的。
第三,更重要的是,目前圍繞著Open AI或者西方科技大廠的大模型已經(jīng)構(gòu)建出了一個初步的生態(tài),國內(nèi)科技大廠或者創(chuàng)業(yè)公司的大模型在技術(shù)和工程上,有很多的地方需要不斷追趕。“如果只是訓練出大模型,沒有人去用,缺少完整生態(tài),也是沒有任何意義的。”
周志峰表示,“最后,我還是非常堅定地看好生成式AI和大模型,它的出現(xiàn)標志著一個巨大的AI開發(fā)范式的轉(zhuǎn)換,將會真正的被利用到更多應用場景。”
封面圖片來源:視覺中國-VCG41N1188747468
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP