每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

DeepSeek開源周收官,顛覆存儲(chǔ)架構(gòu)!OpenAI繼續(xù)“大力出奇跡”,GPT-4.5價(jià)格達(dá)R1的270倍

每日經(jīng)濟(jì)新聞 2025-02-28 19:24:54

每經(jīng)記者 岳楚鵬    每經(jīng)編輯 程鵬 蘭素英    

誰能想到DeepSeek為了搞大模型自己弄了套文件系統(tǒng)?

2月28日,DeepSeek開源周的最后一天,DeepSeek直接公開了V3和R1訓(xùn)練推理過程中用到的Fire-Flyer文件系統(tǒng)(簡稱3FS,第三個(gè)F代表File)和基于3FS和DuckDB構(gòu)建的輕量級(jí)數(shù)據(jù)處理框架Smallpond。

CFF20LXzkOxpJF0KIL0b8soJibfjEviazxApVYLZJbn3jKgSKZTTY14Iiau2BYDDGCqF6flzWLFQWQXBwQZQQdL7A.png

圖片來源:X

3FS是一個(gè)真正意義上面向現(xiàn)代SSD(固態(tài)硬盤)和RDMA(遠(yuǎn)程直接訪問)網(wǎng)絡(luò)的文件系統(tǒng),它可以把固態(tài)硬盤的帶寬性能利用到極致,并表現(xiàn)出了驚人的速度:180節(jié)點(diǎn)集群中的聚合讀取吞吐量為6.6TiB/s;25節(jié)點(diǎn)集群中GraySort基準(zhǔn)測(cè)試的吞吐量為3.66TiB/分鐘;每個(gè)客戶端節(jié)點(diǎn)的KVCache查找峰值吞吐量超過40GiB/s。

KCORES聯(lián)合創(chuàng)始人karminski-牙醫(yī)評(píng)價(jià)道:“DeepSeek顛覆了存儲(chǔ)架構(gòu)?!?/span>

CFF20LXzkOxpJF0KIL0b8soJibfjEviazxtZTgsjKqSYFzj2YH2jDkVWgSzx4CqefKXuhS9CTibBjuToaF1Huqwag.png

圖片來源:X

根據(jù)DeepSeek團(tuán)隊(duì)介紹,3FS就是為了AI訓(xùn)練和推理工作負(fù)載的挑戰(zhàn)所開發(fā)的。它利用現(xiàn)代SSD和RDMA網(wǎng)絡(luò)來提供共享存儲(chǔ)層,從而簡化分布式應(yīng)用程序的開發(fā)。

它可以在沒有雙方操作系統(tǒng)介入的情況下,將數(shù)據(jù)直接從一臺(tái)計(jì)算機(jī)的內(nèi)存?zhèn)鬏數(shù)搅硪慌_(tái)計(jì)算機(jī),也不需要中央處理器、CPU緩存或上下文交換參與。特點(diǎn)就是高通量、低延遲,尤其適合在大規(guī)模并行計(jì)算機(jī)集群中使用。

那這樣方便的系統(tǒng),有什么作用呢?每經(jīng)小編請(qǐng)DeepSeek大模型用白話來解答這一問題。

CFF20LXzkOxpJF0KIL0b8soJibfjEviazxFaeNPl4oq0DwicU9pibDwhGY43vWevzPVqeGOjwibTMnDKCsic29uekBLQ.jpg

而在DeepSeek開源3FS文件系統(tǒng)前幾個(gè)小時(shí),OpenAI推出了期待已久的GPT-4.5,之前這個(gè)模型的代號(hào)為“Orion”。OpenAI聲稱這是其迄今最大、知識(shí)最豐富的模型,現(xiàn)已向每月訂閱費(fèi)用達(dá)200美元的ChatGPT Pro用戶開放。

OpenAI首席執(zhí)行官阿爾特曼表示,新模型的運(yùn)行成本太高了,下周OpenAI將增加數(shù)萬塊GPU,提供算力支撐。

在馬斯克旗下xAI的Grok 3發(fā)布時(shí),大家都興奮地表示,Scaling Law(規(guī)模法則)還沒有撞墻。但GPT-4.5一出,外界發(fā)現(xiàn),OpenAI“撞墻”了。

GPT-4.5的預(yù)訓(xùn)練計(jì)算量是GPT-4的10倍,但是基準(zhǔn)測(cè)試只比4o好5%。在AIME和GPQA等困難的學(xué)術(shù)基準(zhǔn)測(cè)試中,GPT-4.5的表現(xiàn)也達(dá)不到o3-mini、DeepSeek-R1和Claude 3.7 Sonnet等領(lǐng)先AI推理模型的水平。

CFF20LXzkOxpJF0KIL0b8soJibfjEviazxib1ia1pHRpTX3u77on13PoUuElFP449r1lIZRx4B5XYXQfyHGR1QBaJA.jpg

圖片來源:X

阿爾特曼都只能解釋道,雖然它又貴,又慢,又不夠好。但是它有人情味兒。

有博主測(cè)評(píng)后表示,GPT-4.5這情商高得直接把智商干沒了。

CFF20LXzkOxpJF0KIL0b8soJibfjEviazxDvHz8GCwqIDqCW3cQmdvrnthUia7g4txWLQalUso9UChiasQVwuqD3sQ.png

圖片來源:數(shù)字生命卡茲克

而GPT-4.5的價(jià)格也是高到離譜,每百萬Tokens輸出價(jià)格150美元(約合人民幣1093.5元),是其他模型的10~100倍,更別說和DeepSeek比了。

2月26日,DeepSeek宣布了錯(cuò)峰價(jià)格制度,DeepSeek-R1在高峰期每百萬Tokens輸出價(jià)格為2.19美元(約合人民幣15.9元),低谷期的價(jià)格僅為0.55美元 (約合人民幣4元)。以低谷期的價(jià)格計(jì)算,GPT-4.5的價(jià)格是DeepSeek-R1的近270倍。

CFF20LXzkOxpJF0KIL0b8soJibfjEviazxRrBNd7vmxwVCiaPMhSeUoiah403uC7M52ho4BbXzaNeGcVhhibR1nSghw.png

圖片來源:X

DeepSeek為何能做出成本高效的AI模型呢?從這周開源的五大項(xiàng)目就能看出來,DeepSeek主打的就是“榨干”硬件性能。

第一天:FlashMLA架構(gòu),直接“爆改”英偉達(dá)GPU,突破H800計(jì)算上限;

第二天:DeepEP,第一個(gè)用于MoE(混合專家)模型訓(xùn)練和推理的開源EP(專家并行)通信庫,提供高吞吐量和低延遲的all-to-all GPU內(nèi)核;

第三天:DeepGEMM,僅300行代碼的通用矩陣乘法庫;

第四天:連開三源,創(chuàng)新的雙向流水線并行算法DualPipe、用于MoE的負(fù)載均衡算法EPLB,以及訓(xùn)練和推理框架的性能分析數(shù)據(jù);

第五天:3FS和Smallpond,高效的分布式文件系統(tǒng)和以之為基礎(chǔ)的數(shù)據(jù)處理框架壓榨固態(tài)硬盤性能。

在DeepSeek的數(shù)彈連發(fā)后,有網(wǎng)友稱,DeepSeek成領(lǐng)頭羊了。

CFF20LXzkOxpJF0KIL0b8soJibfjEviazx3XdrWia1jIahIiapCQIgooWsuX6gSmOEoDvRFLto4MEbheNGxDj0rPibQ.png

圖片來源:X

那讓我們來看看,DeepSeek是怎么評(píng)價(jià)GPT-4.5這一模型的吧。

CFF20LXzkOxpJF0KIL0b8soJibfjEviazxXaQhRCCnof6n3iaK8xkRxl8y4YdKpq8Lx8wWrlLrRdpUHamlkvBYFbw.jpg

所以說,與其用OpenAI的天價(jià)模型,真不如使用DeepSeek更高效的R1模型。但老是“服務(wù)器繁忙,請(qǐng)稍后再試”,怎么辦?

不用擔(dān)心,2月12日每日經(jīng)濟(jì)新聞App和每經(jīng)網(wǎng)全面接入DeepSeek、Kimi、豆包、智譜清言、文心一言和通義千問6款大模型。用戶通過每日經(jīng)濟(jì)新聞App和每經(jīng)網(wǎng)就能與大模型自由對(duì)話還能一鍵“問公司”“問投資”“問基金”。

不得不說,用起來真的很絲滑,目前使用量已經(jīng)超15萬次了!?

咋用呢?超簡單!

下載每日經(jīng)濟(jì)新聞App

http://m.ship-bio.com/corp/2016app/index.html

再往下看

一、 在每日經(jīng)濟(jì)新聞App首頁,點(diǎn)擊“DeepSeek”圖標(biāo)或首頁輪播圖“自由問+問公司問投資問基金免費(fèi)使用DeepSeek、Kimi、豆包等六款大模型”。

CFF20LXzkOxpJF0KIL0b8soJibfjEviazxGqEz3xMibHB3Pfj9kRiapqbOFvLl9J7lGrPNwrTAfVe9ibGbYGW8ThW6A.jpg

二、 進(jìn)入“每經(jīng)大模型平臺(tái)”頁面,即可使用DeepSeek、Kimi、豆包、智譜清言、文心一言和通義千問6款大模型中任意一款。

CFF20LXzkOxpJF0KIL0b8soJibfjEviazxiaDvgabs2w0RTcTicibXxyhBnZDMYrZeEI1NosP6QibfCh7uHbFkrwQRpw.jpg

最近,每經(jīng)“136計(jì)劃”還增加了新功能:

大模型解讀投資熱榜。

只需點(diǎn)擊投資熱榜中的任意新聞。

CFF20LXzkOxpJF0KIL0b8soJibfjEviazxzpWIrDk5Z25OIrTJQh5oQpWYlk3q76NbsWWIlaXjlBPia4bvcvcwC9g.jpg

立即就能得到大模型的全面分析。

還能一鍵生成圖片分享給朋友。

CFF20LXzkOxpJF0KIL0b8soJibfjEviazxIuBFgYxFzS7dLbGIw9ReYqABhxYXuAleyUFT04r3cesWtl2sOlWOIQ.jpg

CFF20LXzkOxpJF0KIL0b8soJibfjEviazxICibBuO2FVTttKMzIHjceyOZ7yQwFy2YOvbAIHT8pg96poeicLibuPVTA.jpg

告別“服務(wù)器繁忙”

快用每日經(jīng)濟(jì)新聞App吧!

(免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請(qǐng)核實(shí)。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。)

記者|岳楚鵬

編輯|程鵬?蘭素英?杜波

校對(duì)|孫志成

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

|每日經(jīng)濟(jì)新聞 ?nbdnews??原創(chuàng)文章|

未經(jīng)許可禁止轉(zhuǎn)載、摘編、復(fù)制及鏡像等使用

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人 在线 免费