每日經(jīng)濟(jì)新聞
頭條

每經(jīng)網(wǎng)首頁(yè) > 頭條 > 正文

重磅!谷歌推出其最先進(jìn)AI模型Gemini,大規(guī)模多任務(wù)語(yǔ)言理解或超越人類專家

每日經(jīng)濟(jì)新聞 2023-12-07 10:06:17

每經(jīng)編輯 杜宇

OpenAI空前崛起之際,谷歌毅然打響了絕地反擊戰(zhàn)。

當(dāng)?shù)貢r(shí)間12月6日,谷歌公司宣布推出其規(guī)模最大、功能最強(qiáng)大的新大型語(yǔ)言模型Gemini,其最強(qiáng)大的TPU(張量處理單元)系統(tǒng)“Cloud TPU v5p”以及來(lái)自谷歌云的人工智能超級(jí)計(jì)算機(jī)。v5p是今年早些時(shí)候全面推出的Cloud TPU v5e的更新版本,谷歌承諾其速度明顯快于v4 TPU。

值得一提的是在MMLU(大規(guī)模多任務(wù)語(yǔ)言理解)測(cè)試中,Gemini Ultra以90.0%的高分,首次超過(guò)了人類專家。

Gemini的各種能力

據(jù)界面新聞12月7日?qǐng)?bào)道,Gemini 1.0是谷歌籌備了一年之久的GPT4真正競(jìng)品,也是目前谷歌能拿出手的功能最為強(qiáng)悍、適配最為靈活的大模型,包括三種不同套件,分別是Gemini Ultra,Gemini Pro和Gemini Nano。

其中Ultra的能力最強(qiáng),復(fù)雜度最高,能夠處理最為困難的多模態(tài)任務(wù);Pro能力稍弱,是一個(gè)可擴(kuò)展至多任務(wù)的模型;Nano則是一款可以在手機(jī)端側(cè)運(yùn)行的模型。這說(shuō)明,Gemini的觸達(dá)范圍很廣,可以下探至數(shù)據(jù)中心,也可以上行至移動(dòng)設(shè)備端側(cè)。

Gemini模型經(jīng)過(guò)海量數(shù)據(jù)訓(xùn)練,可以很好識(shí)別和理解文本、圖像、音頻等內(nèi)容,并可以回答復(fù)雜主題相關(guān)的問(wèn)題。所以,非常擅長(zhǎng)解釋數(shù)學(xué)和物理等復(fù)雜學(xué)科的推理任務(wù)。

Gemini可以生成和理解Python、Java、C++和Go等主流代碼。Gemini Ultra在多個(gè)編碼基準(zhǔn)測(cè)試中表現(xiàn)出色,包括HumanEval,這是評(píng)估編碼任務(wù)性能的重要行業(yè)標(biāo)準(zhǔn)。

谷歌還基于Gemini模型開發(fā)了專業(yè)的代碼模型AlphaCode 2。與前一代相比,AlphaCode 2的性能提升了至少50%以上。

Gemini的多模態(tài)功能,使其能在視覺理解、文本生成等方面有非常強(qiáng)的功能。例如,從數(shù)十萬(wàn)字的小說(shuō)中整理出重要觀點(diǎn),從200頁(yè)的金融報(bào)告中找出最有價(jià)值的內(nèi)容。這對(duì)于金融、科技、醫(yī)療的科研和業(yè)務(wù)人員來(lái)說(shuō)幫助巨大。

在一段公布的演示視頻中,桑達(dá)爾?皮查伊展示了Gemini對(duì)視頻、圖像的非同凡響的識(shí)別能力。在視頻中,Gemini極為自如地在圖像、音頻、視頻各模態(tài)之間的轉(zhuǎn)換,展現(xiàn)了驚人的解鎖應(yīng)用場(chǎng)景與產(chǎn)品形態(tài)的潛力。

圖片來(lái)源:谷歌演示視頻

僅從谷歌釋出的演示視頻結(jié)果看,市面上現(xiàn)有的全部多模態(tài)大模型與Gemini的性能表現(xiàn)都有代際差,包括Meta 5月開源的跨6個(gè)模態(tài)的AI模型ImageBind以及GPT-4。

圖片來(lái)源:谷歌

一年前,在人工智能開發(fā)機(jī)構(gòu)OpenAI發(fā)布聊天機(jī)器人ChatGPT后,創(chuàng)造了當(dāng)前人工智能熱潮背后大部分基礎(chǔ)技術(shù)的谷歌措手不及,一度發(fā)布了內(nèi)部“紅色警報(bào)”(red code)。一年零一周后,谷歌似乎準(zhǔn)備好了反擊。

據(jù)澎湃新聞,谷歌DeepMind首席執(zhí)行官、Gemini團(tuán)隊(duì)代表德米斯·哈薩比斯(Demis Hassabis)在發(fā)布會(huì)上正面談及GPT-4與Gemini的對(duì)比,“我們對(duì)系統(tǒng)進(jìn)行了非常徹底的分析,并進(jìn)行了基準(zhǔn)測(cè)試。谷歌運(yùn)行了32個(gè)完善的基準(zhǔn)測(cè)試來(lái)比較這兩個(gè)模型,從廣泛的整體測(cè)試(如多任務(wù)語(yǔ)言理解基準(zhǔn)測(cè)試)到比較兩個(gè)模型生成Python代碼的能力。”哈薩比斯略帶微笑地表示,“我認(rèn)為我們?cè)?2項(xiàng)基準(zhǔn)中的30項(xiàng)中大幅領(lǐng)先。”

從發(fā)布日起,Gemini可開始應(yīng)用于Bard和Pixel 8 Pro智能手機(jī),并將很快與谷歌服務(wù)中的其他產(chǎn)品集成,包括Chrome、搜索和廣告等。

目前,谷歌計(jì)劃通過(guò)谷歌云將Gemini授權(quán)給客戶,供他們?cè)谧约旱膽?yīng)用程序中使用。12月13日開始,開發(fā)者和企業(yè)客戶可以通過(guò)谷歌AI Studio或谷歌Cloud Vertex AI中的Gemini API(應(yīng)用程序編程接口)訪問(wèn)Gemini Pro,安卓開發(fā)人員可以使用Gemini Nano完成構(gòu)建。

據(jù)介紹,Gemini Ultra是第一個(gè)在MMLU(大規(guī)模多任務(wù)語(yǔ)言理解)方面超越人類專家的模型,該模型綜合使用數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理學(xué)等57個(gè)科目來(lái)測(cè)試世界知識(shí)和解決問(wèn)題的能力,谷歌在一篇博客文章中表示,它可以理解復(fù)雜主題中的細(xì)微差別和推理。

而據(jù)CNBC報(bào)道,谷歌高管們?cè)谛侣劙l(fā)布會(huì)上表示Gemini Pro的表現(xiàn)優(yōu)于GPT-3.5,但回避了與GPT-4相比如何的問(wèn)題。對(duì)于谷歌是否計(jì)劃對(duì)Bard Advanced的訪問(wèn)收費(fèi),Bard總經(jīng)理蕭茜茜(Sissie Hsiao)表示,谷歌專注于創(chuàng)造良好的體驗(yàn),目前還沒(méi)有任何相關(guān)盈利的細(xì)節(jié)。

谷歌最強(qiáng)TPU與AI超級(jí)計(jì)算機(jī)

與新模型一起亮相的,還有新版本的TPU芯片TPU v5p,旨在減少訓(xùn)練大語(yǔ)言模型相關(guān)的時(shí)間投入。TPU是谷歌為神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)的專用芯片,經(jīng)過(guò)優(yōu)化可加快機(jī)器學(xué)習(xí)模型的訓(xùn)練和推斷速度,谷歌于2016年起開始推出第一代TPU。

據(jù)谷歌介紹,與TPU v4相比,TPU v5p的浮點(diǎn)運(yùn)算性能提升了兩倍,在高帶寬內(nèi)存方面提高了3倍。使用谷歌的600 GB/s芯片間互連,可以將8960個(gè)v5p加速器耦合在一個(gè)Pod(通常指一個(gè)包含多個(gè)芯片的集群或模塊)中,從而更快或更高精度地訓(xùn)練模型。作為參考,該值比TPU v5e大35倍,是TPU v4的兩倍多。

谷歌稱,TPU v5p是其迄今為止最強(qiáng)大的,能夠提供459 teraFLOPS(每秒可執(zhí)行459萬(wàn)億次浮點(diǎn)運(yùn)算)的bfloat16(16位浮點(diǎn)數(shù)格式)性能或918 teraOPS(每秒可執(zhí)行918萬(wàn)億次整數(shù)運(yùn)算)的Int8(執(zhí)行8位整數(shù))性能,支持95GB的高帶寬內(nèi)存,能夠以2.76 TB/s的速度傳輸數(shù)據(jù)。

谷歌表示,所有這些意味著TPU v5p可以比TPU v4更快地訓(xùn)練大型語(yǔ)言模型,如訓(xùn)練GPT-3(1750億參數(shù))這樣的大語(yǔ)言模型速度比TPU v4快2.8倍。

除了新硬件之外,谷歌還引入了“人工智能超級(jí)計(jì)算機(jī)”的概念。谷歌云將其描述為一種超級(jí)計(jì)算架構(gòu),包括一個(gè)集成系統(tǒng),具有開放軟件、性能優(yōu)化硬件、機(jī)器學(xué)習(xí)框架和靈活的消費(fèi)模型。

谷歌計(jì)算和機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施部門副總裁馬克·洛邁爾(Mark Lohmeyer)在博客文章中解釋道,“傳統(tǒng)方法通常通過(guò)零碎的組件級(jí)增強(qiáng)來(lái)解決要求苛刻的人工智能工作負(fù)載,這可能會(huì)導(dǎo)致效率低下和瓶頸。”“相比之下,人工智能超級(jí)計(jì)算機(jī)采用系統(tǒng)級(jí)協(xié)同設(shè)計(jì)來(lái)提高人工智能訓(xùn)練、調(diào)整和服務(wù)的效率和生產(chǎn)力。”這可以理解為,與單獨(dú)看待每個(gè)部分相比,這種合并將提高生產(chǎn)力和效率。換句話說(shuō),超級(jí)計(jì)算機(jī)是一個(gè)系統(tǒng),其中任何可能導(dǎo)致性能低下的變量(硬件或軟件)都受到控制和優(yōu)化。

每日經(jīng)濟(jì)新聞綜合澎湃新聞、界面新聞、公開資料

封面圖片來(lái)源:視覺中國(guó)-VCG111288485345

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

谷歌 MINI Ai

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人 在线 免费