每日經(jīng)濟(jì)新聞 2023-05-29 16:53:21
◎王海峰告訴《每日經(jīng)濟(jì)新聞》記者,一個大模型要得到更好的效果,通常人工智能的算法、算力、數(shù)據(jù)方面都會起很大作用,但更重要的是三者需要進(jìn)行聯(lián)合優(yōu)化。
每經(jīng)記者 張蕊 每經(jīng)編輯 陳旭
5月25日,2023中關(guān)村論壇在北京開幕,論壇將持續(xù)到5月30日。
人工智能大模型發(fā)展論壇現(xiàn)場 每經(jīng)記者 張蕊 攝
在本次論壇的“人工智能大模型發(fā)展”平行論壇上,百度首席技術(shù)官王海峰以《文心一言,讀書破萬億》為題發(fā)表了主旨演講,并通過演講展示了百度全新一代知識增強(qiáng)大語言模型文心一言在知識問答、寫文稿、作詩、生成視頻、推理計算以及工作場景中智能總結(jié)等多方面的能力。
王海峰表示,得益于百度在人工智能技術(shù)領(lǐng)域的全面布局和技術(shù)積累,尤其是飛槳深度學(xué)習(xí)平臺和文心大模型的聯(lián)合優(yōu)化,文心一言在一個多月時間推理性能提升了近10倍,效率更高,效果更好。目前,飛槳深度學(xué)習(xí)平臺已凝聚了535萬開發(fā)者,服務(wù)20萬家企事業(yè)單位,基于飛槳創(chuàng)建了67萬個模型,位居中國深度學(xué)習(xí)平臺市場綜合份額第一。
對于大模型產(chǎn)業(yè)化面臨的挑戰(zhàn),王海峰認(rèn)為,當(dāng)前出現(xiàn)了類似芯片代工廠的模式,一些具有算法、算力和數(shù)據(jù)綜合優(yōu)勢的企業(yè)可以將模型生產(chǎn)的復(fù)雜過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺,為千行百業(yè)提供大模型服務(wù)。
論壇上,王海峰回答了《每日經(jīng)濟(jì)新聞》記者關(guān)于影響AI模型效果的因素有哪些、大模型的核心競爭壁壘是什么、是否每個企業(yè)都需要構(gòu)建自己的大模型的提問。
百度首席技術(shù)官王海峰 圖片來源:主辦方
王海峰告訴《每日經(jīng)濟(jì)新聞》記者,一個大模型要得到更好的效果,通常人工智能的算法、算力、數(shù)據(jù)方面都會起很大作用。“簡單地說,算法有更好的算法,數(shù)據(jù)有更多的數(shù)據(jù),或者有更多算力,但這還不夠,更重要的是三者其實是在聯(lián)合優(yōu)化的。”
“就算力而言,剛才我說到4層架構(gòu),算力是基礎(chǔ),而算力很大程度上實際上是在跟框架平臺這一層打交道。”王海峰說,比如像飛槳這樣一個深度學(xué)習(xí)框架平臺,它跟幾乎所有國際或國內(nèi)的主流芯片都有適配。“而算法當(dāng)然是很核心的,很多進(jìn)步最終還是靠算法。”他說,算法的進(jìn)步效率更高,一個算法的改進(jìn)可能就是多少倍甚至是成數(shù)量級的提升。
而數(shù)據(jù)意味著什么?在王海峰看來,數(shù)據(jù)很大程度上其實是意味著應(yīng)用場景等。建構(gòu)一個基礎(chǔ)的預(yù)訓(xùn)練大模型時數(shù)據(jù)會特別多,這就意味著它有一個基本的通識知識了,但應(yīng)用于各種場景時,每一個場景都會帶來自己的數(shù)據(jù),當(dāng)一個場景要用這種大模型時,往往是針對這個場景的需求標(biāo)注很好的數(shù)據(jù),就會得到事半功倍的效果。
“所以我們?nèi)绻f日常工作,其實這幾方面都在優(yōu)化,而且是在聯(lián)合優(yōu)化,不斷地相互影響、互相迭代。”王海峰說。
封面圖片來源:主辦方
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP