每日經(jīng)濟(jì)新聞 2025-01-26 14:23:38
每經(jīng)記者 岳楚鵬 蘭素英 每經(jīng)編輯 陳柯名
短短一個(gè)月內(nèi),中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)先后發(fā)布了DeepSeek-V3和DeepSeek-R1兩款大模型,成本價(jià)格低廉,性能與OpenAI相當(dāng),讓硅谷震驚,甚至引發(fā)了Meta內(nèi)部的恐慌,工程師們開(kāi)始連夜嘗試復(fù)制DeepSeek的成果。
Scale AI創(chuàng)始人Alexander Wang在1月24日的采訪中表示,DeepSeek在他們的測(cè)試?yán)锸潜憩F(xiàn)最好的,與美國(guó)最好的模型相當(dāng)。
此前,Alexander Wang評(píng)價(jià)說(shuō),DeepSeek-V3是中國(guó)科技界帶給美國(guó)的苦澀教訓(xùn)。“當(dāng)美國(guó)休息時(shí),中國(guó)(科技界)在工作,以更低的成本、更快的速度和更強(qiáng)的實(shí)力趕上?!?/span>
此外,中國(guó)AI“刷屏”國(guó)外各大媒體,它們認(rèn)為中國(guó)大模型的新進(jìn)展為硅谷敲響了警鐘。
在5000億美元的“星際之門(mén)”計(jì)劃公布之際,DeepSeek以極低的價(jià)格建立了一個(gè)突破性的AI模型,而且沒(méi)有使用尖端芯片,讓人們質(zhì)疑,AI行業(yè)數(shù)千億美元資本的巨額投入真的是最有效的方法嗎?
Meta進(jìn)入恐慌模式,試圖復(fù)制DeepSeek
1月24號(hào),一條發(fā)布在匿名平臺(tái)teamblind上的帖子瘋傳。一名Meta員工稱(chēng),現(xiàn)在Meta內(nèi)部因?yàn)镈eepSeek的模型,已經(jīng)進(jìn)入恐慌模式。
這位Meta員工寫(xiě)道:
“一切源于DeepSeek-V3的出現(xiàn),它在基準(zhǔn)測(cè)試中已經(jīng)讓Llama 4相形見(jiàn)絀。更讓人難堪的是,一家‘僅用550萬(wàn)美元訓(xùn)練預(yù)算的中國(guó)公司’就做到了這一點(diǎn)。
工程師們正在爭(zhēng)分奪秒地分析DeepSeek,試圖復(fù)制其中的一切可能技術(shù)。這絕非夸張。
管理層正為GenAI研發(fā)部門(mén)的巨額投入而發(fā)愁。當(dāng)部門(mén)里一個(gè)高管的薪資就超過(guò)訓(xùn)練整個(gè)DeepSeek V3的成本,而且這樣的高管還有數(shù)十位,他們?cè)撊绾蜗蚋邔咏淮?/span>
DeepSeek-R1的出現(xiàn)讓情況更加嚴(yán)峻。具體細(xì)節(jié)屬于機(jī)密,不便透露,不過(guò)很快就會(huì)公開(kāi)了?!?/span>
去年12月27日,DeepSeek推出開(kāi)源模型DeepSeek-V3。當(dāng)時(shí),聊天機(jī)器人競(jìng)技場(chǎng)(Chatbot Arena)顯示,DeepSeek-V3在所有模型中排名第七,在開(kāi)源模型排第一。而且,DeepSeek-V3是全球前十中性?xún)r(jià)比最高的模型。
不到一個(gè)月之后,今年1月20日,DeepSeek正式開(kāi)源R1推理模型,允許所有人在遵循MIT License(注:被廣泛使用的一種軟件許可條款)的情況下,蒸餾R1訓(xùn)練其他模型。
1月24日,DeepSeek-R1在聊天機(jī)器人競(jìng)技場(chǎng)綜合榜單上排名第三,與頂尖推理模型o1并列。
在高難度提示詞、代碼和數(shù)學(xué)等技術(shù)性極強(qiáng)的領(lǐng)域,DeepSeek-R1拔得頭籌,位列第一。
在風(fēng)格控制方面,DeepSeek-R1與o1并列第一,意味著模型在理解和遵循用戶(hù)指令,并按照特定風(fēng)格生成內(nèi)容方面表現(xiàn)出色。
在高難度提示詞與風(fēng)格控制結(jié)合的測(cè)試中,DeepSeek-R1與o1也并列第一,進(jìn)一步證明了其在復(fù)雜任務(wù)和精細(xì)化控制方面的強(qiáng)大能力。
Artificial-Analysis對(duì)DeepSeek-R1的初始基準(zhǔn)測(cè)試結(jié)果也顯示,DeepSeek-R1在AI分析質(zhì)量指數(shù)中取得第二高分,價(jià)格是o1的約三十分之一。
AI大佬驚嘆:中國(guó)AI已追上美國(guó)
去年12月DeepSeek-V3發(fā)布后,AI數(shù)據(jù)服務(wù)公司Scale AI創(chuàng)始人Alexander Wang就發(fā)貼稱(chēng),DeepSeek-V3是中國(guó)科技界帶給美國(guó)的苦澀教訓(xùn)。“當(dāng)美國(guó)休息時(shí),中國(guó)(科技界)在工作,以更低的成本、更快的速度和更強(qiáng)的實(shí)力趕上?!?/span>
著名投資公司A16z的創(chuàng)始人馬克·安德森1月24日發(fā)文稱(chēng),Deepseek-R1是他見(jiàn)過(guò)的最令人驚嘆、最令人印象深刻的突破之一,而且還是開(kāi)源的,它是給世界的一份禮物。
1月24日,A16z合伙人、Mistral AI董事會(huì)成員Anjney Midha表示:“從斯坦福到麻省理工,DeepSeek-R1幾乎一夜之間成為美國(guó)頂尖大學(xué)研究人員的首選模型。”
對(duì)于中國(guó)AI為何能有如此快速的進(jìn)展,諾獎(jiǎng)得主、“AI教父”杰弗里·辛頓在1月21日接受博主Curt Jaimungal專(zhuān)訪中表示,中國(guó)的STEM(科學(xué)、技術(shù)、工程、數(shù)學(xué))教育比美國(guó)更好,擁有更多受過(guò)良好教育的人才,這將為AI的發(fā)展提供堅(jiān)實(shí)的基礎(chǔ)。盡管美國(guó)試圖通過(guò)限制(如英偉達(dá)芯片)來(lái)減緩中國(guó)的發(fā)展,但這只會(huì)促使中國(guó)加速發(fā)展自己的技術(shù),“他們可能會(huì)落后幾年,但最終會(huì)趕上”。
DeepSeek或徹底改變游戲規(guī)則“大力出奇跡”還有效嗎?
斯坦福大學(xué)和Epoch AI的研究人員去年年中發(fā)表了一項(xiàng)研究表明,到2027年,最大型的模型的訓(xùn)練成本將超過(guò)10億美元。Gartner預(yù)測(cè),到2028年Google、Microsoft和AWS等超大規(guī)模企業(yè)僅在AI服務(wù)器上的支出就將高達(dá)5000億美元。
但DeepSeek完全不同,它的訓(xùn)練成本并不昂貴。Noah's Arc資本管理公司表示,DeepSeek-V3模型有可能徹底改變訓(xùn)練和推理領(lǐng)域的游戲規(guī)則。
特別是在5000億美元的“星際之門(mén)”計(jì)劃公布后,DeepSeek更讓人懷疑,巨額投入這種“大力出奇跡”的辦法真是最有效的方法嗎?
美股大V“THE SHORT BEAR”1月24日在X上發(fā)文稱(chēng),DeepSeek給AI巨頭們帶來(lái)了痛苦時(shí)刻,投資者必須對(duì)此敲響警鐘。
他說(shuō):“如果擊敗OpenAI只需要5500萬(wàn)美元,那么這個(gè)行業(yè)的商業(yè)化會(huì)比很多人預(yù)想的要快很多?!?/span>
他還指出:“根據(jù)紅杉,美國(guó)AI公司每年必須產(chǎn)生約6000億美元收入來(lái)支付其AI硬件費(fèi)用?,F(xiàn)在看來(lái),這種冒險(xiǎn)行為變得越來(lái)越無(wú)利可圖。”
著名財(cái)經(jīng)記者Holger Zschaepitz 1月25日表示,DeepSeek以極低的價(jià)格建立了一個(gè)突破性的AI模型,而且沒(méi)有使用尖端芯片,這讓人們質(zhì)疑該行業(yè)數(shù)千億美元資本支出的效用。
有投資者甚至認(rèn)為,美股芯片股的股價(jià)也會(huì)面臨挑戰(zhàn)。
投資者Geiger Capital表示,Deepseek和OpenAI一樣好,甚至更好,而且價(jià)格只有后者的3%……而美國(guó)公司卻投入了數(shù)千億美元。那么……納斯達(dá)克會(huì)怎樣呢?
值得注意的是,DeepSeek-V3發(fā)布后,英偉達(dá)股價(jià)下跌了2%。而DeepSeek-R1引發(fā)海外大討論后,1月24日英偉達(dá)股價(jià)又大跌了3.12%。
外媒集體刷屏:給硅谷敲響警鐘
如果說(shuō)DeepSeek-V3只是掀起了波瀾,那么DeepSeek-R1則是引發(fā)了轟動(dòng)。最近四天,國(guó)外媒體紛紛聚焦DeepSeek,并一致認(rèn)為中國(guó)大模型的新進(jìn)展為硅谷敲響了警鐘。
1月22日,美國(guó)媒體Business Insider報(bào)道稱(chēng),DeepSeek-R1模型秉承開(kāi)放精神,完全開(kāi)源,為美國(guó)AI玩家?guī)?lái)了麻煩。開(kāi)源的先進(jìn)AI可能挑戰(zhàn)那些試圖通過(guò)出售技術(shù)賺取巨額利潤(rùn)的公司。
1月24日,美國(guó)媒體CNBC推出了長(zhǎng)達(dá)40分鐘的節(jié)目,邀請(qǐng)了Perplexity CEO Aravind Srinivas來(lái)分析為何DeepSeek會(huì)引發(fā)人們對(duì)美國(guó)在AI領(lǐng)域的全球領(lǐng)先地位是否正在縮小的擔(dān)憂(yōu)。
英國(guó)《金融時(shí)報(bào)》1月25日?qǐng)?bào)道稱(chēng),中國(guó)小型AI初創(chuàng)公司DeepSeek震驚硅谷。報(bào)道聚焦資源更豐富的美國(guó)AI公司能否捍衛(wèi)自己的技術(shù)優(yōu)勢(shì)。
報(bào)道援引加州大學(xué)伯克利分校AI政策研究員Ritwik Gupta稱(chēng),DeepSeek最近發(fā)布的模型表明“AI能力沒(méi)有護(hù)城河”。Gupta補(bǔ)充說(shuō),中國(guó)的系統(tǒng)工程師人才庫(kù)比美國(guó)大得多,他們懂得如何充分利用計(jì)算資源來(lái)更便宜地訓(xùn)練和運(yùn)行模型。
免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請(qǐng)核實(shí)。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
記者|岳楚鵬??蘭素英?編輯|陳柯名?王嘉琦 蓋源源
校對(duì)|何小桃
|每日經(jīng)濟(jì)新聞 ?nbdnews??原創(chuàng)文章|
未經(jīng)許可禁止轉(zhuǎn)載、摘編、復(fù)制及鏡像等使用
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP