每日經(jīng)濟(jì)新聞 2025-02-07 08:10:26
2月6日晚間,華為宣布,華為DCS AI全棧解決方案中的重要產(chǎn)品—ModelEngine AI平臺(tái)全面支持DeepSeek大模型R1&V3及蒸餾系列模型的本地部署與優(yōu)化,加速AI應(yīng)用落地。ModelEngine基于昇騰AI芯片,提供從數(shù)據(jù)預(yù)處理到模型訓(xùn)練、優(yōu)化及部署的一站式服務(wù)。
每經(jīng)編輯 杜宇
2月6日晚間,華為中國官方微博發(fā)文稱,華為DCS AI全棧解決方案中的重要產(chǎn)品—ModelEngine AI平臺(tái),全面支持DeepSeek大模型R1&V3和蒸餾系列模型的本地部署與優(yōu)化,加速客戶AI應(yīng)用快速落地。
華為稱,ModelEngine作為大模型訓(xùn)練、推理和應(yīng)用開發(fā)的AI平臺(tái),提供從數(shù)據(jù)預(yù)處理到模型訓(xùn)練、優(yōu)化及部署的一站式服務(wù)。此次ModelEngine基于昇騰AI芯片,通過推理框架優(yōu)化和MoE存算協(xié)同,提供動(dòng)態(tài)換入換出和全局統(tǒng)一緩存,實(shí)現(xiàn)推理高并發(fā)和低時(shí)延,用戶通過ModelEngine體驗(yàn)DeepSeek更加快速高效的推理能力。
ModelEngine全面支持DeepSeek系列模型R1&V3 671B以及蒸餾系列模型,開發(fā)者可通過ModelEngine實(shí)現(xiàn)“一鍵部署”,省去硬件選型、兼容性驗(yàn)證和環(huán)境配置等繁瑣步驟,大幅降低企業(yè)AI應(yīng)用門檻。此外,ModelEngine通過其高度的開放性和模塊化設(shè)計(jì),極大地縮短了DeepSeek的本地部署時(shí)間。
ModelEngine提供負(fù)載均衡、模型安全接入、多用戶配額管理等高階特性,支持大規(guī)模生產(chǎn)環(huán)境下的穩(wěn)定運(yùn)行。某證券公司引入DCS AI全棧解決方案后,運(yùn)維成本降低42%。
圖片來源:每日經(jīng)濟(jì)新聞 劉國梅 攝
值得注意的是,2月4日晚間,華為計(jì)算微信公眾號(hào)發(fā)文表示,DeepSeek-R1系列模型的開源,因其出色的性能和低廉的開發(fā)成本,已引發(fā)全球的熱切討論和關(guān)注。潞晨科技攜手昇騰,聯(lián)合發(fā)布基于昇騰算力的DeepSeek-R1系列推理API,及云鏡像服務(wù)。
華為計(jì)算稱,在本次發(fā)布中,潞晨以自研國產(chǎn)推理引擎為技術(shù)底座,成功實(shí)現(xiàn)了昇騰算力與DeepSeek-R1系列模型的推理適配優(yōu)化,性能表現(xiàn)與使用高端GPU持平,為開發(fā)者提供高效、靈活、穩(wěn)定的AI推理服務(wù),助力企業(yè)實(shí)現(xiàn)降本增效,加速智能業(yè)務(wù)基于中國軟硬件體系快速部署落地。
據(jù)華為云官方微信公眾號(hào)2月1日消息,DeepSeek-R1開源后引發(fā)全球用戶和開發(fā)者關(guān)注。經(jīng)過硅基流動(dòng)和華為云團(tuán)隊(duì)連日攻堅(jiān),現(xiàn)在,雙方聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeekR1/V3推理服務(wù)。
該服務(wù)具備以下特點(diǎn):
1、得益于自研推理加速引擎加持,硅基流動(dòng)和華為云昇騰云服務(wù)支持部署的DeepSeek模型可獲得持平全球高端GPU部署模型的效果。
2、提供穩(wěn)定的、生產(chǎn)級(jí)服務(wù)能力,讓模型能夠在?規(guī)模生產(chǎn)環(huán)境中穩(wěn)定運(yùn)行,并滿足業(yè)務(wù)商?部署需求。華為云昇騰云服務(wù)可以提供澎湃、彈性、充足的算力。
另據(jù)國家超算互聯(lián)網(wǎng)平臺(tái)消息,目前DeepSeek-R1、V3、Coder等系列模型已上線該平臺(tái)。用戶無需下載到本地部署,即可在線完成DeepSeek系列模型的推理、部署及定制化訓(xùn)練與開發(fā)。
據(jù)深圳商報(bào),為促進(jìn)超算算力一體化運(yùn)營,打造國家算力底座,科技部于2023年啟動(dòng)了國家超算互聯(lián)網(wǎng)部署工作,2024年4月平臺(tái)正式上線。截至目前,已有數(shù)百家應(yīng)用、數(shù)據(jù)、模型等服務(wù)商入駐。
此次上線的模型涵蓋了1.5B到14B的蒸餾模型,以及7B到32B的DeepSeek Chatbot可視化界面,近期還會(huì)陸續(xù)上線32B、70B等更多版本。
超算互聯(lián)網(wǎng)官微2月4日晚間發(fā)布文章稱,DeepSeek-R1因其游刃有余的用戶需求響應(yīng)能力,尤其是其獨(dú)特的“深度思考(DeepThink)”模式及卓越的推理能力,在這個(gè)春天絕響全球。為了讓更多領(lǐng)域的用戶切實(shí)便捷地進(jìn)行體驗(yàn),超算互聯(lián)網(wǎng)平臺(tái)第一時(shí)間上線了DeepSeek Chatbot可視化界面功能。
圖片來源:視覺中國
據(jù)證券時(shí)報(bào),DeepSeek的熱度居高不下。此前,英偉達(dá)、微軟、亞馬遜等AI巨頭紛紛宣布,已接入DeepSeek。
國內(nèi)幾大云服務(wù)平臺(tái)——華為云、騰訊云、阿里云、百度智能云、京東云、字節(jié)跳動(dòng)旗下火山引擎等,也相繼宣布接入DeepSeek系列模型,部分平臺(tái)推出了超低價(jià)格方案及限時(shí)免費(fèi)服務(wù)。
國內(nèi)三大運(yùn)營商旗下的聯(lián)通云、天翼云、移動(dòng)云等平臺(tái)也宣布接入DeepSeek模型。
1月24日,著名投資公司A16z的創(chuàng)始人馬克·安德森發(fā)文稱,Deepseek-R1是他見過的最令人驚嘆、最令人印象深刻的突破之一,而且還是開源的,它是給世界的一份禮物。最具煽動(dòng)性的評(píng)價(jià)來自ScaleAI創(chuàng)始人亞歷山大·王。他說:過去十年來,美國可能一直在AI競賽中領(lǐng)先于中國,但DeepSeek的AI大模型發(fā)布可能會(huì)“改變一切”。
DeepSeek日前發(fā)布其最新開源模型DeepSeek-R1,用較低的成本達(dá)到了接近于OpenAI開發(fā)的GPT-o1的性能。這一進(jìn)展破解了全球人工智能產(chǎn)業(yè)長期以來“堆算力”的路徑依賴,其影響還波及了資本市場。
國際投行摩根士丹利表示,“更大(的模型)不再等于更聰明”,DeepSeek通過顯著提高數(shù)據(jù)質(zhì)量和改進(jìn)模型架構(gòu),展示了一條與之前大模型不同的高效訓(xùn)練途徑。摩根士丹利說,DeepSeek的模型現(xiàn)在低成本優(yōu)勢突出,與國際知名大模型相比,其成本大約低了一個(gè)數(shù)量級(jí)。
國泰君安指出,DeepSeek-R1以MIT License完全開源模型權(quán)重,并允許商用模型蒸餾,為開發(fā)者提供了二次創(chuàng)新的自由空間。這一策略推動(dòng)中國首次在通用大模型開源領(lǐng)域占據(jù)技術(shù)制高點(diǎn),增強(qiáng)全球AI 話語權(quán)。同時(shí),開源生態(tài)可能加速行業(yè)技術(shù)路線趨同,通用大模型因同質(zhì)化加劇競爭,只有擁有真正領(lǐng)先技術(shù)的企業(yè)才能在這種趨勢中留存。因此,此次國產(chǎn)開源模型的突破有望重塑全球AIGC技術(shù)路線及產(chǎn)業(yè)格局。
每日經(jīng)濟(jì)新聞綜合證券時(shí)報(bào)、深圳商報(bào)、華為中國官方微博、公開資料
封面圖片來源:每日經(jīng)濟(jì)新聞 劉國梅 攝
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP