每日經(jīng)濟新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

DeepSeek開源第四彈:一口氣放出“三劍客”,有梁文鋒參與項目!黃仁勛:DeepSeek引爆芯片需求

每日經(jīng)濟新聞 2025-02-27 19:04:09

每經(jīng)記者 宋欣悅    每經(jīng)編輯 陳柯名 蘭素英    

2月27日,DeepSeek一次性開源了兩個工具和一個數(shù)據(jù)集,分別是DualPipe、EPLB(專家并行負(fù)載均衡器)以及訓(xùn)練和推理框架的性能分析數(shù)據(jù)。此外,DeepSeek還在Github上詳細(xì)講解了DeepSeek-V3和R1模型背后的并行計算優(yōu)化技術(shù)。

CFF20LXzkOz5xOwARoUGibbZUvr0ibJI16w9NLNkm38yYCM9PBsAGVTKyrArhpTHKibiaKdLo4b5pJsHcwlbSfxwbQ.png

圖片來源:X

據(jù)介紹,DualPipe是一種用于V3和R1訓(xùn)練中計算與通信重疊的雙向流水線并行算法。DeepSeek-V3就首次使用了該方法。與傳統(tǒng)的1F1B(交替執(zhí)行前向和后向傳播)和ZB1P(零氣泡單向流水線)方法相比,DualPipe大幅減少了流水線氣泡,同時僅增加了1倍的激活內(nèi)存峰值。

CFF20LXzkOz5xOwARoUGibbZUvr0ibJI16PTvQeS6590Wia8BEfbMkf2cmfE115IJBn2Sj9252L3PuH5Gsep59icmA.png

圖片來源:Github

值得一提的是,在GitHub網(wǎng)站上的DualPipe項目介紹中,DeepSeek創(chuàng)始人梁文鋒在開發(fā)者之列。

EPLB是為V3和R1打造的專家并行負(fù)載平衡器,針對混合專家(MoE)模型的分布式訓(xùn)練和推理設(shè)計。在傳統(tǒng)的MoE模型中,專家負(fù)載的不平衡會導(dǎo)致計算資源的浪費,尤其是在專家并行(EP)的場景下,這種不平衡會進(jìn)一步加劇通信開銷。而EPLB通過動態(tài)調(diào)整每個專家的負(fù)載,確保在訓(xùn)練過程中專家之間的負(fù)載保持平衡。

而公布訓(xùn)練和推理框架的分析數(shù)據(jù)是為了幫助社區(qū)更好地了解通信計算重疊策略和底層實現(xiàn)細(xì)節(jié)。

不過,對于非專業(yè)人士,這些密密麻麻的專業(yè)術(shù)語,著實讓人頭疼。每經(jīng)小編也忍不住想說,“聽君一席話,如聽一席話?!?/span>

還好我們有DeepSeek!

每經(jīng)小編現(xiàn)在就讓DeepSeek-R1模型用生活場景中的示例,把此次開源的三個項目講得明明白白、清清楚楚、透透徹徹!

CFF20LXzkOz5xOwARoUGibbZUvr0ibJI16U6yoiaO6CJJTCposGF4IviayvicjaZ3LzaCee6SnlKq0oDw6iac9X1KFaA.png

美東時間周三(北京時間2月27日凌晨)美股盤后,“宇宙最重要財報”來襲。這份財報也是今年1月末DeepSeek橫空出世后,英偉達(dá)公布的首份財報。

英偉達(dá)披露的最新財報顯示,2025財年第四財季實現(xiàn)營收393.31億美元,同比大幅增長78%,高于市場預(yù)期的380.5億美元。在業(yè)績指引方面,英偉達(dá)預(yù)期2026財年第一財季的營收將達(dá)到430億美元,上下浮動2%,高于市場預(yù)期的417.8億美元。

英偉達(dá)CEO黃仁勛在財報中表示,市場對Blackwell芯片的需求令人驚嘆,因為推理AI增加了另一種擴展法則——增加訓(xùn)練的計算能力使模型更智能,而長時間思考的額外算力使答案更智能。

稍后,黃仁勛在分析師電話會議上表示,“像OpenAI的o3、DeepSeek-R1、Grok 3等模型正是采用了推理時擴展方法的推理模型,其計算資源消耗是(普通模型的)百倍甚至更多。未來,推理模型的計算需求將會更高?!?/span>

黃仁勛還不忘點贊DeepSeek,稱其是一項出色的創(chuàng)新,點燃了全球的熱情。更重要的是,DeepSeek開源了世界級的AI推理模型。

有評論稱,盡管英偉達(dá)的這份財報在一定程度上緩解了市場擔(dān)憂情緒,但投資者還是覺得英偉達(dá)業(yè)績帶來的驚喜不夠大。

那么,我們要如何解讀英偉達(dá)的最新財報呢?英偉達(dá)的業(yè)績又面臨著哪些壓力?

針對上述問題,我們讓一直努力“榨干”英偉達(dá)GPU的“源神”DeepSeek親自來回答一下。

CFF20LXzkOz5xOwARoUGibbZUvr0ibJI16Drw1NHqDaWI9eXRLfZAQuGZ2HNqxicYUTQUWGLscYmZcZSkEuyZ011Q.png

不得不說

DeepSeek解讀得相當(dāng)專業(yè)

要是再分析分析“黃仁勛皮衣銷量是否同步增長”

那不妥妥“財報界單口相聲”!?

But!

“服務(wù)器繁忙,請稍后再試”

真的很讓人頭大!

還好每日經(jīng)濟新聞App火速前來“救場”?

最近,每經(jīng)App接入了DeepSeek

響應(yīng)速度快到飛起,使用起來非常絲滑!

不管是問公司、問投資、問基金,還是自由對話,都輕松拿捏!

目前使用量已經(jīng)超15萬次了!?

咋用呢?超簡單!

先下載每日經(jīng)濟新聞App

http://m.ship-bio.com/corp/2016app/index.html

再往下看

一、在每日經(jīng)濟新聞App首頁,點擊“DeepSeek”圖標(biāo)或首頁輪播圖“自由問+問公司問投資問基金免費使用DeepSeek、Kimi、豆包等六款大模型”。

CFF20LXzkOz5xOwARoUGibbZUvr0ibJI16ptGFhWICgFkSTL2Mpy10rn5bPowwRmOyp6ltWvUhhZR5Q45TydQJcg.png

二、進(jìn)入“每經(jīng)大模型平臺”頁面,即可使用DeepSeek、Kimi、豆包、智譜清言、文心一言和通義千問6款大模型中任意一款。

CFF20LXzkOz5xOwARoUGibbZUvr0ibJI168GAje4C3ibS2S52iavcAeTIjkodYEArovWA21Vfkz5pWY2icxSgW8yic8Q.png

最近,每經(jīng)“136計劃”還增加了新功能:

大模型解讀投資熱榜。

CFF20LXzkOz5xOwARoUGibbZUvr0ibJI16YZAWYG2MCvd7osnZBBtKLSaV9icBfRIiaXZrIbr9G4661vdLsawdZ5EA.png

只需點擊投資熱榜中的任意新聞

立即就能得到大模型的全面分析

還能一鍵生成圖片分享給朋友。

CFF20LXzkOz5xOwARoUGibbZUvr0ibJI16h4jB1Pd2IBviaLYKViaGL8XHEDIgYmECNtGwQAzBGmocxyleWqlnDKicQ.png

CFF20LXzkOz5xOwARoUGibbZUvr0ibJI16lloD8yfSoSVibrwEvticJzeBoO5RyvB62uk0kKGWiaCCQCqtEp5fHrzUQ.png

告別“服務(wù)器繁忙”

快用每日經(jīng)濟新聞App吧!

免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請核實。據(jù)此操作,風(fēng)險自擔(dān)。

記者|宋欣悅??

編輯|陳柯名?蘭素英?王嘉琦

校對|金冥羽

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

|每日經(jīng)濟新聞 ?nbdnews??原創(chuàng)文章|

未經(jīng)許可禁止轉(zhuǎn)載、摘編、復(fù)制及鏡像等使用

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人 在线 免费