每日經(jīng)濟(jì)新聞

要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

剛剛！DeepSeek重大發(fā)布！梁文鋒參與共創(chuàng)！

每日經(jīng)濟(jì)新聞 2025-02-19 00:53:05

每經(jīng)編輯金冥羽

2月18日，DeepSeek在海外社交平臺(tái)發(fā)布了一篇純技術(shù)論文報(bào)告，論文主要內(nèi)容是關(guān)于NSA（Natively Sparse Attention，原生稀疏注意力）。

據(jù)介紹，NSA專為長文本訓(xùn)練與推理設(shè)計(jì)，能利用動(dòng)態(tài)分層稀疏策略等方法，通過針對(duì)現(xiàn)代硬件的優(yōu)化設(shè)計(jì)，顯著優(yōu)化傳統(tǒng)AI模型在訓(xùn)練和推理過程中的表現(xiàn)，特別是提升長上下文的推理能力，在保證性能的同時(shí)提升了推理速度，并有效降低了預(yù)訓(xùn)練成本。

CFF20LXzkOySME66m7r8N7ibHjYjAVFPrynFl1dR0mkG7DLwbZV9pMBxycKciafL0ONp4lwFhKbxBUUfz3L2QxVQ.jpg

在這篇名為《原生稀疏注意力：硬件對(duì)齊且可原生訓(xùn)練的稀疏注意力機(jī)制》（Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention）的論文署名中，DeepSeek創(chuàng)始人兼CEO梁文鋒也作為共創(chuàng)在列。

CFF20LXzkOySME66m7r8N7ibHjYjAVFPrOibRsm9FiaQJ73k5P6JkH1L4Jg5bcibUBLdfjzDqDSul7HbQ1aTqmQuiag.jpg

其他研究人員來自DeepSeek、北大和華盛頓大學(xué)，其中第一作者Jingyang Yuan（袁景陽）是在DeepSeek實(shí)習(xí)期間完成的這項(xiàng)研究。

值得一提的是，今日中午12點(diǎn)（太平洋時(shí)間17日晚8點(diǎn)），馬斯克旗下AI公司xAI發(fā)布了Grok 3及其精簡版Grok 3 mini。發(fā)布會(huì)采用視頻直播形式，觀看人數(shù)超過100萬人。

CFF20LXzkOySME66m7r8N7ibHjYjAVFPraRGGG8So4icn2uCbtb7Y0uDxynOSSNibibZDPjzRYLxsTiarOSbQ61SveQ.png

圖片來源：直播截圖

Grok 3是xAI對(duì)OpenAI的o3-mini和DeepSeek的R1等模型的回應(yīng)，它可以分析圖像和回答問題，并為X上的許多功能提供支持。此前馬斯克在X上造勢(shì)稱，Grok 3是“地球上最聰明的人工智能”。

在此次直播中，馬斯克透露，實(shí)際上，到訓(xùn)練進(jìn)行到92天時(shí)，集群的規(guī)模已經(jīng)擴(kuò)大到了20萬塊GPU。

編輯|金冥羽?杜波

校對(duì)|陳柯名

封面圖片來源：視覺中國

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

每日經(jīng)濟(jì)新聞綜合自券商中國、財(cái)聯(lián)社、公開資料等

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

拿下“地王”兩個(gè)半月，華潤置地火速把展廳開進(jìn)山姆超市

返回每經(jīng)網(wǎng)首頁

下一篇文章

新機(jī)場(chǎng)呼之欲出，它要爭奪“第四城”？

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2025 每日經(jīng)濟(jì)新聞報(bào)社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會(huì)征信網(wǎng)

兒童色情信息舉報(bào)專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

四川省互聯(lián)網(wǎng)舉報(bào)中心

中國互聯(lián)網(wǎng)舉報(bào)中心

每日經(jīng)濟(jì)新聞互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號(hào)：蜀ICP備19004508號(hào)-3 川公網(wǎng)安備 51019002002026號(hào)

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人在线免费