每日經(jīng)濟(jì)新聞 2024-01-19 23:44:27
每經(jīng)AI快訊,2024年1月19日,德邦證券發(fā)布研報點(diǎn)評電子行業(yè)。
算力參數(shù):多廠商逐鹿AI,矩陣計算為核心算力參數(shù)。AI算力參數(shù)種類繁多,其本質(zhì)是精度與運(yùn)算效率的取舍。為更好適應(yīng)AI大模型的訓(xùn)練與推理,F(xiàn)P32 TensorCore,BF16等新興數(shù)據(jù)類型應(yīng)運(yùn)而生。以FP32 Tensor Core為例,其為英偉達(dá)張量計算的數(shù)據(jù)格式,使得模型訓(xùn)練性能大幅提升。英偉達(dá)H200的FP32算力為67TFlops,對應(yīng)FP32 Tensor Core算力為989TFlops,性能大幅提升。而國內(nèi)各算力廠商產(chǎn)品性能迭代順利,華為海思此前發(fā)布的昇騰910在FP16算力性能上接近A100,下一代910B性能有望顯著提升。寒武紀(jì)370對標(biāo)英偉達(dá)L2芯片。海光信息深算三號研發(fā)進(jìn)展順利;龍芯中科第二代圖形處理器LG200單節(jié)點(diǎn)性能達(dá)256GFlops-1TFlops,將基于2K3000的GPGPU技術(shù)及3C6000的龍鏈技術(shù),研制專用GPGPU芯片。
互聯(lián)參數(shù):多卡互聯(lián)為大模型桎梏,國內(nèi)外差距巨大。相比小模型,大模型要求在模型切分后進(jìn)行模型并行。模型并行使得多個GPU能同時運(yùn)行模型的一部分,并在共享結(jié)果后進(jìn)入到下一層。大模型的發(fā)展使得類似英偉達(dá)NVLink、NVSwitch等互聯(lián)技術(shù)的重要性快速提升,同時互聯(lián)性能參數(shù)也成為各大模型實(shí)際效果好壞的重要憑依。大多數(shù)廠商利用PCIe進(jìn)行互聯(lián),而英偉達(dá)的NVLink能夠?qū)崿F(xiàn)GPU間的直接互聯(lián),從而大幅提升通信效率,其NVLink帶寬可達(dá)到900 GB/s。在大規(guī)模高精度的3DFFT、3950億參數(shù)的大模型訓(xùn)練上,H100+NVLink組合的提升顯著。我們認(rèn)為隨著大模型的復(fù)雜化,NVLink等多卡互聯(lián)技術(shù)將愈加重要。在多卡互聯(lián)上,國內(nèi)外廠商亦有所差距。以寒武紀(jì)MLU370-X8為例,寒武紀(jì)為多卡系統(tǒng)專門設(shè)計了MLU-Link橋接卡,其可實(shí)現(xiàn)4張加速卡為一組的8顆思元370芯片全互聯(lián),每張加速卡可獲得200GB/s的通訊吞吐性能,帶寬為PCIe 4.0的3.1倍。但相比英偉達(dá)NVLink 4.0的900GB/s,該互聯(lián)性能僅為英偉達(dá)的22%,仍有較大提升空間。
建議關(guān)注:
算力芯片:寒武紀(jì)(思元590性能有望顯著提升)、海光信息(深算三號研發(fā)進(jìn)展順利)、龍芯中科(將基于2K3000的GPGPU技術(shù)及3C6000的龍鏈技術(shù)研制專用GPGPU芯片)
AI應(yīng)用:??低暋⒋笕A股份、樂鑫科技、晶晨股份、恒玄科技、中科藍(lán)訊
服務(wù)器:工業(yè)富聯(lián)、滬電股份
服務(wù)器存儲:瀾起科技、聚辰股份
先進(jìn)封裝:通富微電、長電科技、甬矽電子、華天科技
風(fēng)險提示:下游需求復(fù)蘇不及預(yù)期,技術(shù)研發(fā)風(fēng)險,國內(nèi)外政策和技術(shù)摩擦不確定性的風(fēng)險。
(來源:慧博投研)
免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請核實(shí)。據(jù)此操作,風(fēng)險自擔(dān)。
(編輯 曾健輝)
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP