每日經(jīng)濟(jì)新聞 2025-01-27 17:43:41
近期,DeepSeek力壓ChatGPT登頂美區(qū)App Store免費(fèi)榜;1月25日,AMD宣布全新的DeepSeek-V3模型已集成至AMD Instinct GPU上。受此影響,今日國內(nèi)DeepSeek概念股“刷屏”,AI智能體、AI語料等概念股領(lǐng)漲;算力硬件股持續(xù)走低。分析認(rèn)為,DeepSeek的低成本意味著大模型對(duì)算力投入的需求可能會(huì)從訓(xùn)練側(cè)向推理側(cè)傾斜,這可能會(huì)對(duì)英偉達(dá)等硬件商的市場(chǎng)地位和戰(zhàn)略布局產(chǎn)生影響。
每經(jīng)記者 楊建 每經(jīng)編輯 趙云
今日A股市場(chǎng)迎來龍年收官戰(zhàn),三大指數(shù)走勢(shì)分化明顯,收盤滬指跌0.06%,創(chuàng)業(yè)板指跌2.73%,收?qǐng)?bào)2063.82點(diǎn)。滬深兩市成交額達(dá)到11179億元,較上周五縮量1041億。
值得注意的是,一邊是DeepSeek概念股“刷屏”,AI智能體、AI語料等概念股領(lǐng)漲。另一邊,算力板塊的銅高速連接、CPO等方向則紛紛領(lǐng)跌,仕佳光子跌超16%,兆龍互連、天孚通信等跌超10%。
這是為何?
據(jù)了解,上述反常現(xiàn)象背后,主要源于“國產(chǎn)AI之光”的大模型DeepSeek力壓ChatGPT,登頂美區(qū)App Store免費(fèi)榜,在國內(nèi)App Store免費(fèi)榜同樣位居第一。在美區(qū)App Store免費(fèi)榜Top100中,DeepSeek和ChatGPT躋身前三。DeepSeek霸榜美國應(yīng)用商店,展現(xiàn)出中國應(yīng)用程序驚人的影響力。
據(jù)悉,DeepSeek推理大模型DeepSeek-R1發(fā)布已經(jīng)過去近一周時(shí)間,開源模型DeepSeek-V3也已經(jīng)發(fā)布了近一個(gè)月。DeepSeek-V3在僅使用2048塊H800 GPU的情況下,完成了6710億參數(shù)模型的訓(xùn)練,成本僅為557.6萬美元,遠(yuǎn)低于其他頂級(jí)模型如GPT-4的10億美元。
受此利好影響,國內(nèi)DeepSeek概念股“刷屏”,AI智能體、AI語料等概念股領(lǐng)漲,甚至連與DeepSeek關(guān)聯(lián)的股東、合作伙伴都被市場(chǎng)挖掘出來炒作一番。
對(duì)此,排排網(wǎng)財(cái)富研究部副總監(jiān)劉有華告訴《每日經(jīng)濟(jì)新聞》記者,AI大模型領(lǐng)域近年來吸引了大量資本投入,盡管大模型在性能上取得了突破,但仍面臨技術(shù)瓶頸與應(yīng)用落地方面的挑戰(zhàn)。大模型訓(xùn)練需要巨額算力支持,而當(dāng)前市場(chǎng)中算力資源的過剩使得成本問題凸顯。國際競(jìng)爭(zhēng)與政策影響,這進(jìn)一步加劇了AI產(chǎn)業(yè)鏈的不確定性。AI應(yīng)用后期的投資機(jī)會(huì)廣泛且多樣,從算力基礎(chǔ)設(shè)施到行業(yè)應(yīng)用,再到生成式AI和端側(cè)AI,均展現(xiàn)出強(qiáng)勁的增長(zhǎng)潛力。
1月25日,英偉達(dá)的“競(jìng)爭(zhēng)對(duì)手”AMD火速為DeepSeek“站臺(tái)”,宣布全新的DeepSeek-V3模型已集成至AMD InstinctGPU上。DeepSeek-V3模型的突破顯著降低了AI培訓(xùn)成本,使AMD GPU成為比英偉達(dá)更具有成本效益的替代品。
國內(nèi)A股市場(chǎng)也迅速做出反應(yīng),今日算力硬件股持續(xù)走低,銅高速連接、CPO等方向領(lǐng)跌,仕佳光子跌超16%,兆龍互連、天孚通信等跌超10%。
OpenAI的成功是以規(guī)模作為大模型的制勝法寶,但是這種“軍備競(jìng)賽”型的模式,帶來了驚人的訓(xùn)練成本,不少公司難以為繼。甚至連臉書母公司Meta也來偷師學(xué)藝,據(jù)澎湃新聞報(bào)道,1月27日,臉書母公司Meta成立了四個(gè)專門研究小組來研究量化巨頭幻方量化旗下的國產(chǎn)大模型DeepSeek的工作原理,并基于此來改進(jìn)旗下大模型Llama。
黑崎資本首席戰(zhàn)略官陳興文告訴記者,DeepSeek的低成本意味著大模型對(duì)算力投入的需求可能會(huì)從訓(xùn)練側(cè)向推理側(cè)傾斜,即未來對(duì)推理算力的需求將成為主要驅(qū)動(dòng)力。而英偉達(dá)等硬件商的傳統(tǒng)優(yōu)勢(shì)更多集中在訓(xùn)練側(cè),這可能會(huì)對(duì)其市場(chǎng)地位和戰(zhàn)略布局產(chǎn)生影響。DeepSeek此次大規(guī)模開源行動(dòng)引發(fā)的行業(yè)震動(dòng),本質(zhì)上是技術(shù)浪潮對(duì)傳統(tǒng)AI研發(fā)范式的結(jié)構(gòu)性沖擊。
陳興文指出,DeepSeek通過MIT協(xié)議開源8個(gè)核心模型并全鏈路公開訓(xùn)練細(xì)節(jié),其以“技術(shù)裸奔”姿態(tài)重構(gòu)了行業(yè)競(jìng)爭(zhēng)規(guī)則——開源生態(tài)的透明性不僅打破閉源體系的技術(shù)黑箱壟斷,更通過全球開發(fā)者社區(qū)的協(xié)同創(chuàng)新形成指數(shù)級(jí)迭代能力。這種開源策略直接顛覆硅谷“算力軍備競(jìng)賽”邏輯,使得DeepSeek低成本大模型對(duì)算力投入的需求可能會(huì)從訓(xùn)練側(cè)向推理側(cè)傾斜,即未來對(duì)推理算力的需求將成為主要驅(qū)動(dòng)力。而英偉達(dá)等硬件商的傳統(tǒng)優(yōu)勢(shì)更多集中在訓(xùn)練側(cè),這可能會(huì)對(duì)其市場(chǎng)地位和戰(zhàn)略布局產(chǎn)生影響。
模型在557萬美元超低成本下實(shí)現(xiàn)性能突破,證明算法創(chuàng)新可對(duì)沖硬件劣勢(shì),為算力受限地區(qū)開辟新路徑。尤其在地緣技術(shù)博弈加劇的背景下,DeepSeek通過囤積高端芯片與優(yōu)化低性能芯片組合的雙軌策略,結(jié)合強(qiáng)化學(xué)習(xí)替代監(jiān)督微調(diào)的技術(shù)突破,成功將硬件約束轉(zhuǎn)化為算法創(chuàng)新驅(qū)動(dòng)力,這種逆境突圍重新定義了全球AI競(jìng)爭(zhēng)格局,這種技術(shù)范式的轉(zhuǎn)變正在催生產(chǎn)業(yè)鏈價(jià)值重構(gòu)。
在算力基建層面,模型訓(xùn)練從粗放型算力堆砌轉(zhuǎn)向精細(xì)化能效管理,倒逼數(shù)據(jù)中心向綠色高效轉(zhuǎn)型。數(shù)據(jù)要素價(jià)值隨之凸顯,特定領(lǐng)域的行為數(shù)據(jù)、專業(yè)語料庫成為模型優(yōu)化的戰(zhàn)略資源,驅(qū)動(dòng)數(shù)據(jù)采集、清洗、標(biāo)注產(chǎn)業(yè)升級(jí)。更深遠(yuǎn)的影響體現(xiàn)在AI應(yīng)用生態(tài):開源模型大幅降低技術(shù)準(zhǔn)入門檻,使得中小企業(yè)能快速部署智能客服、自動(dòng)化文檔處理等輕量化應(yīng)用,而模型輕量化與邊緣計(jì)算結(jié)合,正加速AI能力向物聯(lián)網(wǎng)終端滲透,為智能家居、工業(yè)物聯(lián)網(wǎng)等場(chǎng)景創(chuàng)造落地條件。
陳興文表示,當(dāng)前全球算力市場(chǎng)正陷入“結(jié)構(gòu)性過剩與短缺并存”的困境。中國市場(chǎng)中,大量跨界資本涌入智算中心建設(shè),導(dǎo)致2024年全國建成超1.3萬個(gè)智算中心,但平均利用率不足30%,千卡集群年虧損達(dá)2700萬元。這種過剩本質(zhì)上是低端算力(如A100芯片集群)的盲目擴(kuò)張與高端智能算力(H100/H800)短缺的疊加結(jié)果——實(shí)際需求端,大模型訓(xùn)練所需的智能算力缺口達(dá)53%,更深層矛盾在于技術(shù)迭代速度遠(yuǎn)超硬件建設(shè)周期,當(dāng)企業(yè)耗時(shí)18個(gè)月建成智算中心時(shí),市場(chǎng)主流芯片已從A100升級(jí)至H800,設(shè)備貶值率超40%。
這種粗放式擴(kuò)張反襯出DeepSeek技術(shù)路線的顛覆性:其僅用2048塊H800顯卡、557萬美元成本便訓(xùn)練出性能對(duì)標(biāo)GPT-4o的模型,通過MLA架構(gòu)和強(qiáng)化學(xué)習(xí)飛輪機(jī)制,將訓(xùn)練效率提升至Meta Llama3的11倍,百萬Token推理成本壓至0.55美元(僅為OpenAI的3.6%)。這種“算法優(yōu)化對(duì)沖硬件約束”的模式,不僅證明尖端AI發(fā)展無需依賴無限堆砌算力,更直接動(dòng)搖了美國技術(shù)霸權(quán)的根基。
陳興文表示,DeepSeek的崛起之所以被稱為“美股最大威脅”,源于其對(duì)美國AI商業(yè)邏輯與芯片霸權(quán)的雙重解構(gòu)。技術(shù)層面,其開源策略(MIT協(xié)議開放8個(gè)模型權(quán)重及全鏈路訓(xùn)練細(xì)節(jié))形成全球開發(fā)者協(xié)同創(chuàng)新的“開源飛輪”,相較OpenAI閉源模式展現(xiàn)出指數(shù)級(jí)迭代優(yōu)勢(shì),吸引Meta、Google工程師反向研究其RL技術(shù)框架。
產(chǎn)業(yè)層面,其通過算法創(chuàng)新實(shí)現(xiàn)低算力依賴,削弱了英偉達(dá)高端GPU的不可替代性,導(dǎo)致市場(chǎng)重估英偉達(dá)估值邏輯,引發(fā)其股價(jià)單日暴跌5.8%,連帶日本芯片測(cè)試設(shè)備商Advantest市值蒸發(fā)8.6%。
地緣博弈層面,DeepSeek驗(yàn)證了中國AI企業(yè)“用架構(gòu)創(chuàng)新壓縮技術(shù)代差”的可能性,紐約時(shí)報(bào)評(píng)價(jià)其“使美國芯片封鎖淪為戰(zhàn)略敗筆”,周鴻祎更直言這是“中國突破硅谷技術(shù)鐵幕的里程碑”。資本市場(chǎng)對(duì)此劇烈反應(yīng):納斯達(dá)克期貨下跌1.9%,反映投資者重新評(píng)估全球AI產(chǎn)業(yè)權(quán)力結(jié)構(gòu)。
陳興文表示,這場(chǎng)變革的本質(zhì)是AI競(jìng)爭(zhēng)從“資本密集型”向“創(chuàng)新密集型”的范式遷移。短期算力過剩實(shí)則是低端產(chǎn)能出清的前奏,DeepSeek的技術(shù)路徑預(yù)示未來算力市場(chǎng)將兩極分化:通用算力加速淘汰,智能算力向算法優(yōu)勢(shì)企業(yè)集中。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP