每日經濟新聞 2025-01-21 19:02:25
2024年8月至2025年1月,國內四家AI算力廠商陸續(xù)啟動IPO輔導,其中三家為GPU路線,一家為ASIC路線。這些企業(yè)在技術和團隊方面各有優(yōu)勢,如燧原科技和沐曦股份創(chuàng)始團隊有AMD背景,摩爾線程創(chuàng)始團隊來自英偉達。當下GPU仍是市場主流,但未來隨著AI技術落地,推理市場規(guī)?;虺柧毉h(huán)節(jié),而ASIC在推理領域潛力巨大。
每經記者 朱成祥 每經編輯 楊夏
2024年,AI浪潮持續(xù)翻涌,寒武紀(688256.SH,股價625元,市值2609.1億元)作為A股AI算力芯片龍頭可謂風頭無兩,Wind數據顯示,去年寒武紀股價上漲387.55%,同期科創(chuàng)100指數則下跌8.56%。
在寒武紀“獨領風騷”的二級市場之外,國內還有一批優(yōu)秀的AI算力芯片企業(yè)尚未登陸資本市場,如壁仞科技、天數智芯、燧原股份、摩爾線程、沐曦等。其中,壁仞科技、燧原股份、摩爾線程、沐曦目前已進入上市輔導階段。
AI算力芯片主要可以分為GPU(圖形處理器)、AI ASIC(人工智能專用處理器)和FPGA(現場可編程門陣列)三種。目前,國內GPU廠商代表有壁仞科技、天智數芯、摩爾線程和沐曦等;AI ASIC廠商代表有華為海思昇騰、燧原股份、地平線、黑芝麻智能、比特大陸等。
盡管位列Wind GPU指數(8841701.WI)成分股,但根據寒武紀招股書,其將自己的產品與傳統(tǒng)芯片CPU、GPU等進行了區(qū)分,稱“主要研發(fā)通用型智能芯片”,而不是專用型智能芯片(ASIC)。不過,在多家券商和咨詢機構的研報中,均將其產品列為了ASIC。
根據國泰君安證券研報,AI芯片主要分為三種類型:通用型(GPU)、半定制型(FPGA)、定制型(ASIC)。三類芯片代表分別有英偉達(NVIDIA)的GPU、賽靈思的FPGA和Google的TPU(一種專門為機器學習任務設計的AI ASIC)。GPU的計算能力最強,但是成本高、功耗高;FPGA可編程,最靈活,但是計算能力不強;ASIC體積小、功耗低,適合量產,但是研發(fā)時間長,且不可編輯,前期投入成本高,帶來一定的技術風險。
在寒武紀招股書中,將自己的產品與傳統(tǒng)CPU、GPU等芯片類型進行了區(qū)分,而是列為通用型智能芯片和專用型智能芯片(ASIC)兩類。其中,通用型智能芯片代表包括寒武紀思元100/270/220)、華為海思(Ascend 310/910)、谷歌(TPU V1/V2/V3、TPU EDGE)等。
在國泰君安證券研報中,谷歌TPU、華為海思昇騰910均被分類為ASIC。此外,燧原股份的云燧T20與寒武紀的NPU在整體性能上也與谷歌比肩。
此外,民生證券研報顯示,云端算力中,寒武紀也被劃入了ASIC。
頭豹研究院AI行業(yè)高級分析師常喬雨也告訴《每日經濟新聞》記者:“目前國內從事AI ASIC研發(fā)的廠商主要包括寒武紀、地平線、燧原科技、黑芝麻智能和比特大陸等。”
不過,寒武紀、燧原科技的芯片可能更偏向于DSA(領域專用架構),不屬于傳統(tǒng)不可編程的ASIC,而是廣義的ASIC。
傳統(tǒng)ASIC不可編程,于是DSA應運而生。常喬雨表示:“DSA芯片在性能和靈活性之間找到平衡點,成為ASIC和GPGPU(通用圖形處理器計算)之外的另一條技術路徑。DSA結合了ASIC的高性能優(yōu)勢和GPGPU(通用圖形處理器)的編程靈活性,專為特定領域的計算需求設計,尤其適用于泛安防和自動駕駛等明確場景。”
他補充表示:“整體來看,ASIC、GPGPU和DSA各有側重:ASIC注重特定任務的極致性能,GPGPU強調通用性,而DSA則嘗試去結合兩者的優(yōu)點,帶來性價比和效率更高的算力。”
燧原股份相關工作人員也回復《每日經濟新聞》記者稱:“我們是DSA架構。”
黑芝麻智能也對記者表示:“黑芝麻智能的芯片架構兼具ASIC的高性能和GPGPU的靈活性,芯片產品可以歸為ASIC芯片類別,和以上芯片(寒武紀、華為海思昇騰、燧原科技)架構類似,都具備靈活編程的擴展性。”
簡而言之,DSA屬于廣義ASIC芯片,且較傳統(tǒng)ASIC更加靈活。
2024年8月以來,國內四大AI算力廠商陸續(xù)啟動IPO輔導。2024年8月26日,AI ASIC領域代表廠商燧原科技啟動IPO輔導;GPGPU領域代表廠商壁仞科技于9月11日啟動IPO輔導;11月12日,GPU廠商摩爾線程啟動IPO輔導。
進入2025年,1月15日,沐曦股份也啟動了上市輔導。若四家全部上市成功,將大幅擴展A股AI算力廠商投資標的的供給。
這幾家接受IPO輔導的企業(yè)中,燧原科技創(chuàng)始團隊有AMD背景,其創(chuàng)始人兼COO張亞林于2008年加入AMD,歷任資深芯片經理、技術總監(jiān)。曾經作為全球芯片研發(fā)主要負責人之一,在AMD上海研發(fā)中心成功領導開發(fā)并量產了多顆世界級芯片,擁有豐富的工程和產品化實戰(zhàn)經驗。
沐曦股份創(chuàng)始團隊同樣來自AMD,其創(chuàng)始人陳維良曾任AMD全球GPGPU設計總負責人;兩位CTO(首席技術官)均為前AMD首席科學家,目前分別負責公司軟硬件架構。
而摩爾線程創(chuàng)始團隊來自全球GPU巨頭英偉達,其創(chuàng)始人兼CEO張建中曾任英偉達全球副總裁、中國區(qū)總經理,在GPU這一行業(yè)已經深耕近二十年。
除了這四家接受IPO輔導的廠商外,天數智芯、昆侖芯、平頭哥等廠商也廣受市場關注。
另外,目前接受IPO輔導的四家廠商中,三家屬于GPU路線,一家屬于ASIC路線。當下,以英偉達為代表的GPU算力廠商仍是市場主流,而近期以博通為代表的ASIC路線也逐漸受到廣泛關注。
對于GPU路線與ASIC路線的優(yōu)劣,TrendForce集邦咨詢分析師邱珮雯回復《每日經濟新聞》記者認為:“ASIC在可見的未來不會完全取代GPU,ASIC通常是專門為某種特定應用或運算去設計的芯片,如訓練或推理,偏向特定客戶定制化;而GPU設計為通用運算,對于執(zhí)行多樣任務較具靈活性,通常為標準品,適用于多數客戶,且相較于高階英偉達芯片如B200,ASIC目前開發(fā)運算效能落差仍大。因此,ASIC和GPU有各自的目標市場及應用。”
常喬雨認為:“當前,AI ASIC的應用主要集中在推理任務上,盡管部分產品也涉及訓練領域,但推理顯然是其核心戰(zhàn)場。這是因為推理任務具有固定的計算模式和高吞吐量需求,非常契合ASIC硬件固化的高效特性。與此同時,推理的市場空間未來也將顯著超過訓練。隨著人工智能技術在各行業(yè)的加速滲透,終端設備和云端推理的需求量快速增長,涵蓋了從智能家居到工業(yè)自動化再到車載計算的多樣化場景。而推理任務的高頻調用和長生命周期特點,也決定了這一市場的規(guī)模潛力將遠超一次性投入較高的訓練環(huán)節(jié)。”
也就是說,當下AI仍以訓練為主導,GPU仍是主流。而未來,隨著AI技術的廣泛落地,推理市場規(guī)?;虼蠓^訓練環(huán)節(jié)。而推理環(huán)節(jié),正是AI ASIC的主戰(zhàn)場。
事實上,ASIC芯片不僅在推理領域潛力巨大,在類似智駕等特定場景的應用也前景廣闊。
黑芝麻智能方面告訴《每日經濟新聞》記者:“黑芝麻智能的智駕芯片在高性能、低功耗、靈活性、跨域融合、市場定位和端到端算法參考模型等方面都有顯著優(yōu)勢。由于黑芝麻智能智駕芯片面向特定場景,因此算力的利用率、能效比都會更高。在靈活性方面,黑芝麻智能的芯片設計融入了可編程性,使其在一定程度上具備GPGPU的靈活性。”
目前,國際上主流AI ASIC廠商為博通、Marvell。需要注意的是,博通不僅擁有AI ASIC設計能力,其配套網絡業(yè)務也十分強大,比如以太網交換芯片、PCIe/CXL Retimer等。而英偉達算力領域的三大壁壘,包括GPGPU芯片、NVLink和CUDA生態(tài)。而國內廠商在軟件工具鏈和開發(fā)者生態(tài)方面尚待補強。
根據國聯證券研報,AI大模型的快速發(fā)展推動“算力”“存力”需求快速增長。與此同時,對“運力”也提出了更高的需求。系統(tǒng)需要更高的帶寬,更快的傳輸。但內存的性能提升速度遠低于處理器的性能提升速度,導致處理器無法充分發(fā)揮其計算能力。
英偉達有NVLink,博通有CXL技術,那么國內在“運力”領域有哪些布局呢?
國內CXL高速互聯廠商國數集聯告訴《每日經濟新聞》記者:“NVLink具備高帶寬和低延遲的優(yōu)點,但存在生態(tài)封閉、價格昂貴等問題。主要運用在英偉達產品中。CXL基于PCIe的基礎上發(fā)展而來,專注于優(yōu)化處理器與加速器之間的通信。CXL能夠提供高帶寬、低延遲的通信,并支持先進的大容量低延遲內存協同特性。CXL也是唯一橫跨運力和存力的互聯標準、唯一橫跨通用服務器和AI服務器的互聯標準。”
目前國內也有較多的AI ASIC廠商。那么,國數集聯在高速互聯領域有哪些獨特的優(yōu)勢,是否有意與AI算力芯片廠商合作,共同研發(fā)、拓展市場?
國數集聯表示:“公司面向人工智能數據中心(AIDC)、云服務商、服務器廠商以及運營商,提供先進的高速互聯算法、芯片及方案。目前,公司的核心產品包括CXL Switch芯片、模塊以及硬件整體方案。國數集聯正與國內的云廠商、AI廠商、運營商展開合作,旨在提供高效的數據傳輸和聯結方案。”
大模型發(fā)展迅速,也對各大廠商軟硬件結合能力提出更高要求。而國內不少GPGPU廠商,也開始走向“異構計算”。
天數智芯副總裁鄒翾對《每日經濟新聞》記者表示:“異構計算在訓練和推理領域都占據著重要地位。在訓練領域,面對大規(guī)模數據集和復雜模型結構,單一類型芯片往往難以滿足計算需求。異構計算通過整合多種不同架構芯片,可以加速訓練過程,減少訓練時間和成本。在推理領域,實時性要求極高,異構計算能夠根據不同的推理任務特性,靈活調配硬件資源。例如在處理圖像、語音等特定類型數據時,通過不同芯片的協同工作,快速完成推理,輸出準確結果。”
資料顯示,天數智芯是國內率先支持智算芯片混合訓練的通用GPU廠商。其“天垓”和“智鎧”產品系列,廣泛應用于主流大模型的訓練、微調以及推理任務。2024年,天數智芯參加了在上海市通信管理局和上海市數據局的支持下,多家單位聯合開展的跨域異構算力網絡實驗驗證工作,異構混訓效率可達97.5%。
壁仞科技向記者提供的資料也顯示,公司正聯合客戶、合作伙伴、科研機構共同推動異構GPU協同訓練生態(tài),具體包括:中國移動、中國電信、中興通訊、商湯科技、國網智能電網研究院有限公司、上海智能算力科技有限公司、上海人工智能實驗室、中國信息通信研究院等。
壁仞科技表示,這一異構GPU協同訓練方案最終實現了國產GPU和英偉達GPU的異構共存,突破異構算力孤島難題,加快國產GPU的落地遷移,助力國產大模型落地。此外,該方案賦能整個算力產業(yè)發(fā)展,壁仞HGCT方案具備普適性、易用性、兼容性,助力最終客戶實現多種異構算力聚合,最大化異構GPU集群利用效率。
在邊緣側,AI PC又將如何發(fā)展呢?未來AI算力芯片是否可能作為單獨的“外掛”芯片,類似于獨立顯卡搭配在AI PC之中?
天智數芯表示:“目前這種外掛AI芯片的AI PC已有原型,并且已經有用戶在使用。隨著AI在PC端應用場景不斷拓展,如智能創(chuàng)作、數據分析等,對算力需求劇增。將AI算力芯片做成‘外掛’,便于用戶根據自身需求靈活升級,提升AI性能,就像現在人們按需選擇獨立顯卡。同時,這也有助于降低PC整體成本,促進AI技術在PC領域的普及。”
可以看出,除了寒武紀外,國內未上市的企業(yè)中,也有較多GPGPU廠商、AI ASIC廠商,且在“運力”、軟件生態(tài)領域,國內廠商也在積極布局。
封面圖片來源:視覺中國-VCG41N970174988
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP