每日經(jīng)濟(jì)新聞 2025-03-29 21:20:04
當(dāng)算力資源的靈活調(diào)度成為新趨勢(shì),國(guó)產(chǎn)算力芯片的全面普及還面臨哪些挑戰(zhàn)?《每日經(jīng)濟(jì)新聞》記者走訪中國(guó)電信臨港智算谷了解到,AI算力需要消耗大量電力,為降低運(yùn)營(yíng)成本,路徑包括引入光伏發(fā)電、購(gòu)買綠電、探索虛擬電廠,算力中心會(huì)向客戶提供柴發(fā)、儲(chǔ)能、光伏等虛擬機(jī)組資源,優(yōu)化能源利用和成本控制。
每經(jīng)記者 張韻 每經(jīng)編輯 董興生
DeepSeek上線以來(lái),國(guó)產(chǎn)算力資源的采購(gòu)意愿顯著提升。
3月24日,《每日經(jīng)濟(jì)新聞》記者在上海電信“算力超市”看到,數(shù)據(jù)安全敏感型的企業(yè)更傾向于選擇專屬化部署方案。相比傳統(tǒng)IDC(互聯(lián)網(wǎng)數(shù)據(jù)中心)服務(wù),云端專屬算力服務(wù)已支持專線接入DeepSeek大模型,進(jìn)一步解決本地一體機(jī)的成本痛點(diǎn)。結(jié)合智云網(wǎng)絡(luò),政務(wù)、教育、醫(yī)療等行業(yè)企業(yè)也可選擇邊緣云計(jì)算方案,保證數(shù)據(jù)安全。
當(dāng)算力資源的靈活調(diào)度成為新趨勢(shì),國(guó)產(chǎn)算力芯片的全面普及還面臨哪些挑戰(zhàn)?記者走訪中國(guó)電信臨港智算谷了解到,AI算力需要消耗大量電力,為降低運(yùn)營(yíng)成本,路徑包括引入光伏發(fā)電、購(gòu)買綠電、探索虛擬電廠,算力中心會(huì)向客戶提供柴發(fā)、儲(chǔ)能、光伏等虛擬機(jī)組資源,優(yōu)化能源利用和成本控制。
圖片來(lái)源:每經(jīng)記者 張韻 攝
但不可否認(rèn)的是,這場(chǎng)由技術(shù)驅(qū)動(dòng)、政策支持、市場(chǎng)需求共同推動(dòng)的算力革命,正在悄悄改變國(guó)產(chǎn)算力的命運(yùn),芯片廠商迎來(lái)了從技術(shù)適配邁向商業(yè)落地的關(guān)鍵階段。
“剛剛周末退出來(lái)兩臺(tái)設(shè)備,如果客戶想要,可以馬上續(xù)上。”3月24日,星期一,在中國(guó)電信上海分公司的天翼云能力運(yùn)營(yíng)中心,不時(shí)有企業(yè)咨詢不同芯片算力卡的服務(wù)費(fèi)用。
放下電話,解決方案中心經(jīng)理宋蒙向記者表示,在滿足性能要求的基礎(chǔ)上如何降低成本是客戶最大的訴求。今年DeepSeek大模型的問(wèn)世,不僅加劇了AI算法領(lǐng)域的開(kāi)源競(jìng)爭(zhēng),也推動(dòng)了國(guó)產(chǎn)芯片的適配進(jìn)程,可以說(shuō)今年是國(guó)產(chǎn)算力發(fā)展的機(jī)遇期。
自2022年起,從A100、H100到“降級(jí)版”A800、H800,美國(guó)限制高端AI芯片對(duì)華出口背后的底層邏輯是基于AI訓(xùn)練“大力出奇跡”的認(rèn)知,即認(rèn)為更大的AI模型、更多算力資源就意味著更智能的AI。然而,這一認(rèn)知似乎正在被新的算法范式打破。
今年1月,DeepSeek通過(guò)Transformer架構(gòu)優(yōu)化、混合精度訓(xùn)練、計(jì)算并行優(yōu)化以及分布式存儲(chǔ)管理等技術(shù)創(chuàng)新,大幅降低AI訓(xùn)練和推理的計(jì)算需求。小而美且開(kāi)源的DeepSeek,不僅讓全球反思“堆卡燒錢”的OpenAI路線是否走偏,也為國(guó)產(chǎn)算力芯片和云服務(wù)商打開(kāi)通往AGI(通用人工智能)的另一扇窗。
在宋蒙看來(lái),中國(guó)AI應(yīng)用落地受限于兩大瓶頸。首先,英偉達(dá)構(gòu)建的CUDA生態(tài)護(hù)城河,讓AI大模型向國(guó)產(chǎn)算力芯片的遷移變得困難;其次,在國(guó)產(chǎn)大模型百花齊放、國(guó)產(chǎn)芯片廠商不斷涌現(xiàn)的背景下,多對(duì)多的算法和算力適配更是困難重重。
“但DeepSeek很好地解決了第二個(gè)問(wèn)題。”宋蒙告訴記者,它讓原本發(fā)散的模型側(cè)有了一次收斂,現(xiàn)在華為、沐曦、天數(shù)、壁仞、寒武紀(jì)、昆侖芯等在內(nèi)的算力芯片廠商,都與DeepSeek完成了模型適配,“將算子調(diào)優(yōu),有的可以跑671B滿血版,有的能跑蒸餾版,或多或少都能跑起來(lái)了”。
此外,三大運(yùn)營(yíng)商全面接入DeepSeek后,其GPU利用率及IDC上架率也有所提升。電信天翼云自主研發(fā)的“息壤”智算平臺(tái),也在今年2月完成了國(guó)產(chǎn)算力芯片與DeepSeek-R1/V3系列大模型的深度適配優(yōu)化。
3月24日,《每日經(jīng)濟(jì)新聞》記者走進(jìn)上海電信“算力超市”,運(yùn)維人員正在電腦前監(jiān)控著算力調(diào)度的實(shí)時(shí)數(shù)據(jù)。宋蒙介紹,DeepSeek改變了國(guó)產(chǎn)算力的命運(yùn),企業(yè)本地化部署需求進(jìn)一步躍升。
圖片來(lái)源:每經(jīng)記者 張韻 攝
談及DeepSeek帶來(lái)的業(yè)務(wù)變化,3月25日,中國(guó)電信董事長(zhǎng)兼首席執(zhí)行官柯瑞文在2024年度業(yè)績(jī)說(shuō)明會(huì)上表示,息壤DeepSeek一體機(jī)推出后簽約額已達(dá)6億元,從內(nèi)部資源使用來(lái)看,自有算力售賣率已超過(guò)90%,相比DeepSeek上線前翻倍。
此外,中國(guó)電信天翼云官網(wǎng)訪問(wèn)量也在兩周內(nèi)增加了5.7萬(wàn)人次,為DeepSeek上線前的16至17倍。與此同時(shí),模型服務(wù)和token調(diào)用量都呈現(xiàn)出了指數(shù)級(jí)的增長(zhǎng)。
火爆的需求背后是企業(yè)對(duì)部署方式的多樣化選擇。宋蒙告訴記者,企業(yè)使用DeepSeek目前有四種模式,最先是公有云SaaS(軟件即服務(wù))部署,這種方式便捷、價(jià)低但數(shù)據(jù)存儲(chǔ)在云端,使用API(應(yīng)用程序編程接口)接口的應(yīng)用級(jí)對(duì)接,也存在一定的隱私和安全風(fēng)險(xiǎn)。
為了避免數(shù)據(jù)泄露,一些企業(yè)開(kāi)始采取本地化部署。“他們會(huì)在自己的機(jī)房單獨(dú)購(gòu)買GPU服務(wù)器,將開(kāi)源大模型DeepSeek裝在服務(wù)器上,連到企業(yè)自己的內(nèi)網(wǎng)就可以使用了。這種方式保證了數(shù)據(jù)安全,但最大的問(wèn)題就是太貴了。”宋蒙坦言。
記者也在走訪中發(fā)現(xiàn),金融類企業(yè)通常會(huì)采用自建機(jī)房的方式進(jìn)行算力的本地化部署,但需要一次性支付百萬(wàn)元的三年結(jié)算價(jià)及后期一定比例的維保費(fèi)用,才能以租賃的形式長(zhǎng)期使用機(jī)柜服務(wù),這對(duì)于只想短期部署或是對(duì)價(jià)格敏感的企業(yè)而言,無(wú)疑是一個(gè)負(fù)擔(dān)。
宋蒙告訴記者,市場(chǎng)之所以如此定價(jià)是為了拉平硬件投資回報(bào),避免回款風(fēng)險(xiǎn)。目前,部署一套DeepSeek滿血版軟硬件的價(jià)格非常高昂,訂購(gòu)GPU服務(wù)器后,還需要做硬件的集成、機(jī)房的改造、專線的部署等。
于是,為滿足數(shù)據(jù)安全、成本節(jié)約的需求,“公共算力服務(wù)平臺(tái)”應(yīng)運(yùn)而生。上海電信將其形象地稱為“算力超市”,企業(yè)可以通過(guò)產(chǎn)品訂購(gòu),享受到運(yùn)營(yíng)商級(jí)的機(jī)房環(huán)境、獨(dú)立的硬件資源以及專屬的DeepSeek模型。
為了進(jìn)一步降低用戶的使用門檻,《每日經(jīng)濟(jì)新聞》記者了解到,向市場(chǎng)推出云端專屬算力服務(wù),用1%的月租成本撬動(dòng)同性能算力供應(yīng)??電信運(yùn)營(yíng)商正不斷探索降低成本的銷售模式。
那么,相比于傳統(tǒng)的IDC服務(wù),公共算力服務(wù)在商業(yè)模式上有怎樣的范式創(chuàng)新?
“在模型收費(fèi)的時(shí)代,企業(yè)用戶一般會(huì)向模型廠商自行采購(gòu)軟件,由模型供應(yīng)商負(fù)責(zé)安裝部署?,F(xiàn)在,開(kāi)源模型本身是免費(fèi)的,算力超市可以提供安裝部署服務(wù)。對(duì)企業(yè)而言,把模型下載下來(lái),安裝到服務(wù)器上,并能正常跑起來(lái),也是一個(gè)技術(shù)活。”宋蒙打了一個(gè)比方,如果把傳統(tǒng)IDC機(jī)柜服務(wù)看作是一套“毛坯房”,那么算力超市就是“精裝修”,熱門模型與算力芯片都已打包,企業(yè)可以實(shí)現(xiàn)“拎包入住”。
而面對(duì)中小企業(yè)的“臨時(shí)性算力需求”,更低的成本、更簡(jiǎn)化的模型需求催生了更為靈活的解決方案。上海電信進(jìn)一步將一臺(tái)物理服務(wù)器切成了單卡與多卡,以小時(shí)計(jì)費(fèi),企業(yè)只要支付3元/卡時(shí)的價(jià)格,就可以進(jìn)行AI的開(kāi)發(fā)調(diào)測(cè)及訓(xùn)練推理,這有效提升了公共算力服務(wù)的普惠性。
業(yè)界對(duì)模型算力的認(rèn)知也在快速迭代。近日,螞蟻集團(tuán)Ling團(tuán)隊(duì)發(fā)表論文稱,實(shí)驗(yàn)表明,MoE(混合專家)大模型可在國(guó)產(chǎn)芯片上訓(xùn)練出與英偉達(dá)H800芯片相當(dāng)?shù)男Ч?,且?xùn)練成本降低20%。
中國(guó)正在經(jīng)歷一場(chǎng)低調(diào)的算力革命,這無(wú)疑點(diǎn)燃了“去英偉達(dá)化”的希望。從華為910B撐起千億參數(shù)模型訓(xùn)練,到DeepSeek帶動(dòng)國(guó)產(chǎn)芯片廠商完成軟硬件協(xié)同適配,國(guó)產(chǎn)算力正試圖通過(guò)算法創(chuàng)新與硬件迭代實(shí)現(xiàn)彎道超車。
隨著國(guó)產(chǎn)芯片借勢(shì)崛起,未來(lái),普惠型“算力超市”又該如何保證優(yōu)質(zhì)算力資源上架,降低硬件迭代的采購(gòu)風(fēng)險(xiǎn)?3月24日,《每日經(jīng)濟(jì)新聞》記者進(jìn)一步走訪中國(guó)電信臨港智算中心園區(qū)尋求答案。
來(lái)到園區(qū),一棟棟5層高的數(shù)據(jù)機(jī)樓正在加緊建設(shè)。記者看到,1.1期項(xiàng)目已全面投產(chǎn),兩路市電經(jīng)220KV變電站向智算集群輸送穩(wěn)定電力,并配備一棟柴發(fā)機(jī)樓應(yīng)對(duì)突發(fā)事件的用電需求。
走進(jìn)臨港智算谷,現(xiàn)場(chǎng)物業(yè)部經(jīng)理向記者介紹,1.2期的主體結(jié)構(gòu)已經(jīng)基本建造完畢,正在進(jìn)行二次結(jié)構(gòu)及內(nèi)部裝修施工,整個(gè)項(xiàng)目一期工程占地119畝,將于12月份正式投入使用。二期項(xiàng)目計(jì)劃分四批開(kāi)發(fā),計(jì)劃2026—2029每年交付兩棟?rùn)C(jī)樓。
“隨著DeepSeek的火爆出圈,我們針對(duì)本地化部署需求推出了標(biāo)準(zhǔn)化、模塊化、定制化的算力基礎(chǔ)服務(wù)。”臨港算力項(xiàng)目部項(xiàng)目經(jīng)理時(shí)云松告訴記者,面對(duì)算力行業(yè)迅速發(fā)展和需求多樣化趨勢(shì),客戶對(duì)交付周期提出了更高的要求,臨港智算谷的建設(shè)難點(diǎn)在于如何快速且有效滿足客戶需求。
目前,已有企業(yè)對(duì)建設(shè)中的數(shù)據(jù)機(jī)樓訂購(gòu)了包樓服務(wù)。對(duì)此,項(xiàng)目部需要在園區(qū)建設(shè)上進(jìn)行超前考量,結(jié)合客戶對(duì)機(jī)樓層高以及實(shí)際荷載要求,以“兩彈一優(yōu)”的高標(biāo)準(zhǔn)提高供電、散熱、制冷、承重等基礎(chǔ)設(shè)施能力,從而實(shí)現(xiàn)快速響應(yīng)和定制化的基礎(chǔ)服務(wù)。
行至數(shù)據(jù)機(jī)樓3層,記者跟隨時(shí)云松步入冷板式液冷核心機(jī)房,耳邊傳來(lái)背板風(fēng)冷設(shè)備高速運(yùn)轉(zhuǎn)的呼呼聲,走進(jìn)液冷DC艙內(nèi),體感溫度相比機(jī)房室溫明顯下降。時(shí)云松告訴記者,國(guó)產(chǎn)萬(wàn)卡池使用了3∶7的風(fēng)冷液冷配比達(dá)到供冷最優(yōu),使PUE(評(píng)價(jià)數(shù)據(jù)中心能源效率的指標(biāo))保持在低于1.25的水平。另外,規(guī)模化智算機(jī)架還規(guī)劃配備了32臺(tái)浸沒(méi)式液冷設(shè)備。
時(shí)云松稱,臨港智算中心的國(guó)產(chǎn)萬(wàn)卡算力池,使用的算力卡主要集中在華為910B,另有壁仞、沐曦等國(guó)產(chǎn)算力卡也已基本完成性能測(cè)試,目前應(yīng)用于國(guó)產(chǎn)混訓(xùn)項(xiàng)目中。
圖片來(lái)源:每經(jīng)記者 張韻 攝
宋蒙補(bǔ)充道,目前,國(guó)產(chǎn)算力廠商不斷推出新型GPU芯片,如果能夠以更低的成本給客戶使用,公司也愿意引入此類產(chǎn)品,但需經(jīng)過(guò)國(guó)產(chǎn)GPU創(chuàng)新聯(lián)合基地的測(cè)評(píng),只有性能符合要求、價(jià)格為市場(chǎng)所接受的算力資源才會(huì)最終上架。
“長(zhǎng)久運(yùn)營(yíng)好算力超市,要做好質(zhì)量與服務(wù)兩件事。”在談及未來(lái)的長(zhǎng)期規(guī)劃時(shí),宋蒙認(rèn)為,向客戶提供高質(zhì)量的算力服務(wù),不僅體現(xiàn)在擁有琳瑯滿目的算力產(chǎn)品,還要提供滿足客戶需求的使用服務(wù),圍繞客戶的真實(shí)使用場(chǎng)景,推出模型調(diào)優(yōu)、AI應(yīng)用等進(jìn)階服務(wù)。
宋蒙觀察發(fā)現(xiàn),如今越來(lái)越多的客戶不僅需要算力和模型,更想要能直接上手的AI應(yīng)用。中國(guó)電信正準(zhǔn)備上架一系列AI應(yīng)用,涉及專屬智能問(wèn)答、AI企業(yè)法務(wù)、智能公文寫(xiě)作等細(xì)分領(lǐng)域。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP