每日經(jīng)濟新聞 2024-02-22 09:45:11
每經(jīng)編輯 杜宇
開源領(lǐng)域大模型,迎來了重磅新玩家。
當(dāng)?shù)貢r間周三(2月21日),科技巨頭谷歌發(fā)布了新一代開源模型“Gemma”,公司稱其是輕量級中“最先進的”開放模型系列,超越了原本最強的Mistral 7B。
谷歌官網(wǎng)寫道,Gemma在拉丁語中意為“寶石”,以此命名的開放模型系列Gemma由Google DeepMind等團隊開發(fā),采用了與創(chuàng)建Gemini模型相同的研究和技術(shù)。
目前,Gemma系列有兩種權(quán)重規(guī)模的模型,分別為“Gemma 2B”和“Gemma 7B”,即20億參數(shù)和70億參數(shù),以滿足開發(fā)人員的不同需求。
在性能方面,官方頁面顯示,Gemma 7B在MMLU(大規(guī)模多任務(wù)語言理解)的得分率達到64.3%。在同等規(guī)模中,原本最強Mistral 7B的得分率為62.5%,Meta的Llama-2 7B和13B也都與其有一定的差距。
Gemma也第一時間上線了 HuggingFace 和 HuggingChat,每個人都能試一下它的生成能力:
在Hugging Face的LLM leaderboard集中式排行榜上,Gemma的2B和7B模型的平均得分也位于各自參數(shù)規(guī)模的榜單前列。
谷歌在新聞稿中寫道,Gemma 2B和7B與其他開放模型相比,展現(xiàn)出在同等參數(shù)規(guī)模中最先進的性能,甚至超過了一些更大的模型,這得益于與公司最強的AI模型Gemini共享技術(shù)和基礎(chǔ)架構(gòu)。
軟件工程師Jeff dean稱,盡管體量較小,但Gemma模型已經(jīng)在關(guān)鍵基準(zhǔn)測試中明顯超越了更大的模型,對比的包括Llama-2 7B和13B,以及風(fēng)頭正勁的Mistral 7B。
而且Gemma能夠直接在開發(fā)人員的筆記本電腦或臺式電腦上運行。除了輕量級模型之外,谷歌還推出了鼓勵協(xié)作的工具以及負(fù)責(zé)任地使用這些模型的指南。
Keras作者François Chollet對此直接表示:最強開源大模型的位置現(xiàn)在易主了。
谷歌和Alphabet公司CEO 桑達爾·皮查伊(Sundar Pichai)表示,Gemma展示了強大的性能,從今天開始,該模型將在全球范圍內(nèi)提供,并可在筆記本電腦、工作站或谷歌云上運行。
Google DeepMind CEO Demis Hassabis表示,輕量開源的Gemma是同類尺寸中性能最佳的模型。
如今,谷歌不僅將對手瞄向OpenAI,而且打算占據(jù)一切,新模型將比扎克伯格的Llama-2“遙遙領(lǐng)先”。
谷歌計劃未來推出更多的Gemma變體,以適應(yīng)更廣泛的應(yīng)用場景。目前,想要開始使用這些模型的開發(fā)者可以通過數(shù)據(jù)科學(xué)平臺Kaggle、谷歌的Colab筆記本或通過谷歌云進行訪問。
每日經(jīng)濟新聞綜合谷歌官網(wǎng)、公開資料
封面圖片來源:每經(jīng)記者 鄭雨航 攝
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP