每日經(jīng)濟(jì)新聞 2025-03-06 09:50:46
每經(jīng)記者 葉曉丹 每經(jīng)編輯 楊夏
每經(jīng)杭州3月6日電(記者葉曉丹)3月6日凌晨,阿里巴巴發(fā)布并開(kāi)源全新的推理模型通義千問(wèn)QwQ-32B。通過(guò)大規(guī)模強(qiáng)化學(xué)習(xí),千問(wèn)QwQ-32B在數(shù)學(xué)、代碼及通用能力上實(shí)現(xiàn)了質(zhì)的飛躍,整體性能比肩DeepSeek-R1。在保持強(qiáng)勁性能的同時(shí),千問(wèn)QwQ-32B還大幅降低了部署使用成本,在消費(fèi)級(jí)顯卡上也能實(shí)現(xiàn)本地部署。
目前,阿里已采用寬松的Apache2.0協(xié)議,將千問(wèn)QwQ-32B模型向全球開(kāi)源,所有人都可免費(fèi)下載及商用。
阿里云介紹,千問(wèn)QwQ-32B是阿里探索推理模型的最新成果。在冷啟動(dòng)基礎(chǔ)上,阿里通義團(tuán)隊(duì)針對(duì)數(shù)學(xué)和編程任務(wù)、通用能力分別進(jìn)行了兩輪大規(guī)模強(qiáng)化學(xué)習(xí),在32B的模型尺寸上獲得了令人驚喜的推理能力提升,印證了大規(guī)模強(qiáng)化學(xué)習(xí)可顯著提高模型性能。
(封面圖片來(lái)源:每日經(jīng)濟(jì)新聞 資料圖)
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP