每日經(jīng)濟(jì)新聞 2024-03-19 07:09:32
每經(jīng)編輯 畢陸名
號(hào)稱今年全球頭號(hào)人工智能(AI)領(lǐng)域開(kāi)發(fā)者大會(huì)的英偉達(dá)2024 GTC AI大會(huì)于美東時(shí)間3月18日周一拉開(kāi)帷幕。今年是英偉達(dá)時(shí)隔五年首次讓年度GTC重回線下,也是此前分析認(rèn)為英偉達(dá)要“拿出點(diǎn)真家伙”的AI盛會(huì)。
當(dāng)?shù)貢r(shí)間周一下午,英偉達(dá)創(chuàng)始人兼CEO黃仁勛在美國(guó)加州圣何塞SAP中心進(jìn)行主題為“面向開(kāi)發(fā)者的1#AI峰會(huì)”(1#AI Conference for Developers)演講。黃仁勛介紹了運(yùn)行AI模型的新一代芯片和軟件。英偉達(dá)正式推出名為Blackwell的新一代AI圖形處理器(GPU),預(yù)計(jì)將在今年晚些時(shí)候發(fā)貨。
Blackwell平臺(tái)能夠在萬(wàn)億參數(shù)級(jí)的大型語(yǔ)言模型(LLM)上構(gòu)建和運(yùn)行實(shí)時(shí)生成式AI,而成本和能耗比前身低25倍。
另?yè)?jù)媒體報(bào)道,英偉達(dá)CEO黃仁勛在GTC宣布,將在其企業(yè)軟件訂閱中增加一款名為NIM的新產(chǎn)品。NIM可以更容易地使用舊的英偉達(dá)GPU進(jìn)行推理,并允許公司繼續(xù)使用他們已經(jīng)擁有的數(shù)億個(gè)英偉達(dá)GPU。該產(chǎn)品將使新人工智能模型的初始訓(xùn)練推理所需的算力更少。該公司的策略是讓購(gòu)買英偉達(dá)服務(wù)器的客戶注冊(cè)英偉達(dá)企業(yè)版,每個(gè)GPU每年收取費(fèi)用4500美元。黃仁勛表示,該軟件還將幫助在配備GPU的筆記本電腦上運(yùn)行人工智能,而不是在云服務(wù)器上運(yùn)行。
此外,英偉達(dá)CEO黃仁勛宣布推出下一代人工智能超級(jí)計(jì)算機(jī),英偉達(dá)還發(fā)布6G研究云平臺(tái),以便用AI技術(shù)推進(jìn)無(wú)線通信。
據(jù)外媒報(bào)道,英偉達(dá)于周一宣布推出新一代人工智能芯片和用于運(yùn)行人工智能模型的軟件。該公司在美國(guó)圣何塞舉行的開(kāi)發(fā)者大會(huì)上宣布了這一消息,正值這家芯片制造商尋求鞏固其作為人工智能公司首選供應(yīng)商的地位。
自O(shè)penAI的ChatGPT于2022年末掀起人工智能熱潮以來(lái),英偉達(dá)的股價(jià)上漲了五倍,總銷售額增長(zhǎng)了兩倍多。英偉達(dá)的高端服務(wù)器GPU對(duì)于訓(xùn)練和部署大型AI模型至關(guān)重要。微軟和Meta等公司已經(jīng)花費(fèi)了數(shù)十億美元購(gòu)買這些芯片。
圖片來(lái)源:視頻截圖
新一代AI圖形處理器命名為Blackwell。首款Blackwell芯片名為GB200,將于今年晚些時(shí)候發(fā)貨。英偉達(dá)正在用更強(qiáng)大的芯片吸引客戶,以刺激新訂單。例如,各公司和軟件制造商仍在爭(zhēng)相搶購(gòu)當(dāng)前一代的“Hopper”H100芯片及類似產(chǎn)品。
“Hopper很棒,但我們需要更大的GPU,”英偉達(dá)首席執(zhí)行官黃仁勛周一在該公司于加利福尼亞州舉行的開(kāi)發(fā)者大會(huì)上表示。不過(guò),周一盤后交易中,英偉達(dá)股價(jià)下跌超過(guò)1%。該公司還推出了名為NIM的創(chuàng)收軟件,該軟件將簡(jiǎn)化AI的部署,為客戶提供了在日益增多的競(jìng)爭(zhēng)者中堅(jiān)持使用英偉達(dá)芯片的另一個(gè)理由。
英偉達(dá)高管表示,該公司正從一個(gè)唯利是圖的芯片提供商轉(zhuǎn)變?yōu)楦裎④浕蛱O果的平臺(tái)提供商,其他公司可以在此基礎(chǔ)上構(gòu)建軟件。
“Blackwell不僅僅是一款芯片,而是一個(gè)平臺(tái)的名稱,”黃仁勛表示。
英偉達(dá)企業(yè)副總裁Manuvir Das在接受采訪時(shí)表示:“可銷售的商業(yè)產(chǎn)品是GPU,而軟件則是為了幫助人們以不同的方式使用GPU。當(dāng)然,我們現(xiàn)在仍然這樣做。但真正改變的是,我們現(xiàn)在真的有了商業(yè)軟件業(yè)務(wù)。”
Das表示,英偉達(dá)的新軟件將更容易在任何英偉達(dá)GPU上運(yùn)行程序,甚至是那些可能更適合部署而不是構(gòu)建AI的老舊GPU。“如果你是開(kāi)發(fā)者,你有一個(gè)有趣的模型,你希望人們采用它,如果你把它放入NIM中,我們會(huì)確保它可以在我們所有的GPU上運(yùn)行,這樣你就可以覆蓋很多人,”Das說(shuō)道。
英偉達(dá)每?jī)赡旮乱淮纹銰PU架構(gòu),實(shí)現(xiàn)性能的飛躍。過(guò)去一年發(fā)布的許多AI模型都是在該公司的Hopper架構(gòu)上訓(xùn)練的,該架構(gòu)被用于H100等芯片,于2022年宣布推出。
圖片來(lái)源:視頻截圖
據(jù)悉,英偉達(dá)稱,Blackwell擁有六項(xiàng)革命性的技術(shù),可以支持多達(dá)10萬(wàn)億參數(shù)的模型進(jìn)行AI訓(xùn)練和實(shí)時(shí)LLM推理:
全球最強(qiáng)大的芯片:Blackwell架構(gòu)GPU由2080億個(gè)晶體管組成,采用量身定制的臺(tái)積電4納米工藝制造,兩個(gè)reticle極限GPU裸片將10 TB/秒的芯片到芯片鏈路連接成單個(gè)統(tǒng)一的GPU。
第二代Transformer引擎:結(jié)合了Blackwell Tensor Core技術(shù)和TensorRT-LLM和NeMo Megatron框架中的英偉達(dá)先進(jìn)動(dòng)態(tài)范圍管理算法,Blackwell將通過(guò)新的4位浮點(diǎn)AI支持雙倍的計(jì)算和模型大小推理能力。
第五代NVLink:為提高數(shù)萬(wàn)億參數(shù)和混合專家AI模型的性能,最新一代英偉達(dá)NVLink為每個(gè)GPU提供了突破性的1.8TB/s雙向吞吐量,確保最復(fù)雜LLM之間多達(dá)576個(gè)GPU之間的無(wú)縫高速通信。
RAS引擎:Blackwell支持的GPU包含一個(gè)專用引擎,實(shí)現(xiàn)可靠性、可用性和服務(wù)性。此外,Blackwell架構(gòu)還增加了芯片級(jí)功能,利用基于AI的預(yù)防性維護(hù)進(jìn)行診斷和預(yù)測(cè)可靠性問(wèn)題。這可以最大限度地延長(zhǎng)系統(tǒng)正常運(yùn)行時(shí)間,并提高大部署規(guī)模AI的彈性,使其能連續(xù)運(yùn)行數(shù)周甚至數(shù)月,并降低運(yùn)營(yíng)成本。
安全人工智能:先進(jìn)的機(jī)密計(jì)算功能可在不影響性能的情況下保護(hù)AI模型和客戶數(shù)據(jù),并支持新的本機(jī)接口加密協(xié)議,這對(duì)于醫(yī)療保健和金融服務(wù)等隱私敏感行業(yè)至關(guān)重要。
解壓縮引擎:專用解壓縮引擎支持最新格式,加快數(shù)據(jù)庫(kù)查詢,提供數(shù)據(jù)分析和數(shù)據(jù)科學(xué)的最高性能。未來(lái)幾年,在企業(yè)每年花費(fèi)數(shù)百億美元的數(shù)據(jù)處理方面,將越來(lái)越多地由GPU加速。
圖片來(lái)源:視頻截圖
Blackwell GPU體積龐大,將兩個(gè)單獨(dú)制造的晶粒組合成一個(gè)由臺(tái)積電制造的芯片。它還將作為一款名為GB200 NVLink 2的整個(gè)服務(wù)器提供,該服務(wù)器結(jié)合了72個(gè)Blackwell GPU和其他旨在訓(xùn)練AI模型的英偉達(dá)部件。
亞馬遜、谷歌、微軟和甲骨文將通過(guò)云服務(wù)提供對(duì)GB200的訪問(wèn)。GB200將兩個(gè)B200 Blackwell GPU與一個(gè)基于Arm的Grace CPU配對(duì)。英偉達(dá)表示,亞馬遜網(wǎng)絡(luò)服務(wù)將構(gòu)建一個(gè)包含20000個(gè)GB200芯片的服務(wù)器集群。
英偉達(dá)沒(méi)有提供新款GB200或其使用系統(tǒng)的成本。據(jù)分析師估計(jì),英偉達(dá)基于Hopper的H100芯片成本在2.5萬(wàn)至4萬(wàn)美元之間,而整個(gè)系統(tǒng)的成本高達(dá)20萬(wàn)美元。
英偉達(dá)還宣布,將在其英偉達(dá)企業(yè)軟件訂閱中添加一款名為NIM(英偉達(dá)推理微服務(wù))的新產(chǎn)品。NIM讓使用較舊的英偉達(dá)GPU進(jìn)行推理(或運(yùn)行AI軟件的過(guò)程)變得更加簡(jiǎn)單,并允許公司繼續(xù)使用其已經(jīng)擁有的數(shù)億個(gè)英偉達(dá)GPU。與新AI模型的初始訓(xùn)練相比,推理所需的計(jì)算能力較少。對(duì)于那些希望運(yùn)行自己的AI模型,而不是從OpenAI等公司購(gòu)買AI結(jié)果作為服務(wù)的企業(yè)來(lái)說(shuō),NIM無(wú)疑是他們的得力助手。
英偉達(dá)的策略是吸引購(gòu)買基于英偉達(dá)的服務(wù)器的客戶注冊(cè)英偉達(dá)企業(yè)版,每個(gè)GPU每年的許可費(fèi)為4500美元。
英偉達(dá)將與微軟或Hugging Face等AI公司合作,確保他們的AI模型能夠在所有兼容的英偉達(dá)芯片上運(yùn)行。隨后,開(kāi)發(fā)者可以使用NIM在自有服務(wù)器或基于云端的英偉達(dá)服務(wù)器上高效運(yùn)行模型,無(wú)需繁瑣的配置過(guò)程。
“在我原本調(diào)用OpenAI的代碼中,我只需替換一行代碼,將其指向從英偉達(dá)獲取的NIM即可。”Das說(shuō)道。
英偉達(dá)表示,該軟件還將助力AI在配備GPU的筆記本電腦上運(yùn)行,而非僅限于云端服務(wù)器。
每日經(jīng)濟(jì)新聞綜合第一財(cái)經(jīng)、公開(kāi)消息
免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請(qǐng)核實(shí)。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
封面圖片來(lái)源:視頻截圖
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP