每日經(jīng)濟(jì)新聞 2024-05-18 17:08:27
每經(jīng)記者 文巧 蔡鼎 譚玉涵 每經(jīng)編輯 蘭素英 孫宇婷
●當(dāng)?shù)貢r(shí)間5月13日,GPT-4o震撼發(fā)布,阿爾特曼稱其為OpenAI“有史以來最好的模型”。到底有多厲害?又是如何“煉”成的?《每日經(jīng)濟(jì)新聞》記者從4大維度進(jìn)行測評(píng)。
●本周,OpenAI首席科學(xué)家蘇茨克沃和他的親信萊克雙雙離職。此外,他們共同領(lǐng)導(dǎo)的“超級(jí)智能對(duì)齊團(tuán)隊(duì)”也在周五被證實(shí)解散。年初至今公司已有9人離職。
●《大空頭》原型繼續(xù)看漲中概股;腦機(jī)試驗(yàn)招募第二名患者;更多內(nèi)容,盡在《一周國際財(cái)經(jīng)》。
四大維度深度體驗(yàn)多模態(tài)性能,GPT-4o為何被稱作“最強(qiáng)大模型”?
去年3月,GPT-4震撼發(fā)布,距今已逾一年。盡管科技巨頭如谷歌、Meta,以及硅谷新貴如Mistral AI、Anthropic在那之后都爭相發(fā)布了競品大模型,但似乎至今還未有第二款大模型達(dá)到與GPT-4一般橫掃科技圈的力量——直到GPT-4o的誕生。
當(dāng)?shù)貢r(shí)間5月13日,OpenAI在萬眾期待中推出了名為GPT-4o的新一代旗艦AI模型。當(dāng)日,OpenAI首席執(zhí)行官阿爾特曼發(fā)推文表示,新的GPT-4o是OpenAI“有史以來最好的模型”。
據(jù)悉,GPT-4o支持文字、圖像、語音和視頻輸入和輸出,OpenAI承諾未來將免費(fèi)讓普通用戶使用,同時(shí)將開放API給GPT開發(fā)者,價(jià)格直接便宜50%。目前,該模型僅開放了文本和圖像功能。
本周,《每日經(jīng)濟(jì)新聞》記者從圖像和文本兩大層面深度體驗(yàn)了GPT-4o的效果,著重識(shí)圖能力的測試。綜合來看,GPT-4o在反應(yīng)速度上有極大的提升,識(shí)圖方面冠絕群雄,不僅能夠準(zhǔn)確識(shí)別圖片,還能以類人的思維理解圖像內(nèi)容。而在長文本總結(jié)方面,與當(dāng)前模型的差距并不突出。
GPT-4o到底是如何“煉”成的?當(dāng)?shù)貢r(shí)間5月15日,OpenAI聯(lián)合創(chuàng)始人之一John Schulman在接受科技播客主持人Dwarkesh Patel采訪時(shí)透露,后訓(xùn)練是提高模型性能的關(guān)鍵因素。
基于圖片類型,記者將識(shí)圖功能的測評(píng)分為4大維度,分別為普通圖像、特定專業(yè)領(lǐng)域的圖像、數(shù)據(jù)圖像和手寫圖像。
一、普通圖像識(shí)別
(1)內(nèi)容較為單一的圖像
記者首先選取了一張波士頓動(dòng)力機(jī)器人跨越障礙物的圖像,內(nèi)容較為簡單,圖上無文字,隨后要求大模型仔細(xì)識(shí)圖并描述內(nèi)容。GPT-4o非常出色地完成了任務(wù),細(xì)節(jié)描述無可匹敵,準(zhǔn)確無誤地識(shí)別了機(jī)器人的運(yùn)動(dòng)狀態(tài)、地面障礙等豐富細(xì)節(jié)。
(2)內(nèi)容較為復(fù)雜的漫畫
接著,記者選取了由多個(gè)圖像組成、內(nèi)容較為復(fù)雜的漫畫。GPT-4o可以完整地總結(jié)出每一格漫畫的內(nèi)容,并以準(zhǔn)確的順序進(jìn)行講述。更令人吃驚的是,GPT-4o完全以類人的思維解構(gòu)了漫畫的邏輯,它能夠理解這是一種“擬人和夸張的手法”,并準(zhǔn)確理解了漫畫的幽默感。
二、特定專業(yè)領(lǐng)域的圖像
(1)醫(yī)學(xué)領(lǐng)域
記者準(zhǔn)備了一張mRNA疫苗工作原理圖,圖像并未直接說明這是一張疫苗工作原理圖,但圖上寫有相應(yīng)文字,例如“刺突蛋白”、“蛋白質(zhì)翻譯”和“脂質(zhì)納米顆粒”等術(shù)語。
GPT-4o的表現(xiàn)驚艷,不僅準(zhǔn)確識(shí)別了該圖的主旨內(nèi)容,并依據(jù)圖示上的過程用通俗的語言解釋了mRNA疫苗的工作原理。
(2)房地產(chǎn)領(lǐng)域
接著,記者選取了一張建筑面積134平方米的戶型圖,讓大模型識(shí)圖并總結(jié)戶型優(yōu)劣勢。GPT-4o呈現(xiàn)了總體令人較為滿意的結(jié)果,該模型不僅能識(shí)別戶型基本情況,分辨出“半贈(zèng)送”的建筑面,也能夠清楚地總結(jié)戶型的優(yōu)劣勢,但在數(shù)據(jù)準(zhǔn)確性上有待提高。
圖片來源:GPT-4o
三、數(shù)據(jù)圖像的分析和轉(zhuǎn)換
在此維度下,記者選取了一張折柱混合數(shù)據(jù)圖。GPT-4o能夠準(zhǔn)確地識(shí)別數(shù)據(jù)圖上的信息,并按要求以圖表的形式重新呈現(xiàn),準(zhǔn)確率高達(dá)100%。
圖片來源:GPT-4o
四、手寫指令和邏輯推理
最后,記者上了點(diǎn)難度,用手寫的邏輯推理題來測試了GPT-4o的識(shí)圖和邏輯推理能力。GPT-4o的回答堪稱完美,不僅準(zhǔn)確識(shí)別了手寫體文字并遵照指示,且答題邏輯完全合理,也最終給出了正確答案。
圖片來源:GPT-4o
除了識(shí)圖功能之外,記者也從文本層面對(duì)GPT-4o的長文本總結(jié)功能進(jìn)行了測評(píng)。記者選取了一篇近萬字的調(diào)查稿件,讓其總結(jié)要點(diǎn)。GPT-4o不負(fù)眾望地完成了任務(wù)。
圖片來源:GPT-4o
GPT-4o是如何“煉”成的?后訓(xùn)練功不可沒
從前述體驗(yàn)看,GPT-4o的反應(yīng)速度和多模態(tài)能力令人印象深刻。OpenAI首席執(zhí)行官阿爾特曼直言,新的GPT-4o是OpenAI“有史以來最好的模型”。
那么,GPT-4o的多模態(tài)能力是如何“煉”成的呢?這背后的秘密或許可以從OpenAI聯(lián)合創(chuàng)始人John Schulman當(dāng)?shù)貢r(shí)間5月15日與科技播客主持人Dwarkesh Patel的對(duì)話中一窺究竟。
John Schulman在采訪中提到,后訓(xùn)練(Post-Training)是提高模型性能的有效方法,通過額外的訓(xùn)練和微調(diào)可以顯著提高模型的能力。
在這里需要區(qū)分兩個(gè)關(guān)鍵的概念,在大模型訓(xùn)練中通常會(huì)提到“預(yù)訓(xùn)練”、“后訓(xùn)練”等術(shù)語。預(yù)訓(xùn)練常在大規(guī)模的數(shù)據(jù)集上進(jìn)行(通常是讓模仿互聯(lián)網(wǎng)上的內(nèi)容),目標(biāo)是通過在較大的任務(wù)上訓(xùn)練模型,使得模型學(xué)習(xí)到通用的特征。
而后訓(xùn)練指的是專注針對(duì)特定行為優(yōu)化模型,在預(yù)訓(xùn)練模型的基礎(chǔ)上,使用額外的大規(guī)模未標(biāo)注語料庫繼續(xù)訓(xùn)練模型參數(shù),這個(gè)過程可以進(jìn)一步豐富模型對(duì)語言的理解和生成能力,使其獲得更廣泛的知識(shí)。
根據(jù)John Schulman的說法,后訓(xùn)練是GPT-4模型不斷升級(jí)的關(guān)鍵因素。據(jù)悉,當(dāng)前 GPT-4 的 Elo分?jǐn)?shù)(編者注:一種大模型基準(zhǔn)評(píng)級(jí)標(biāo)準(zhǔn))比最初發(fā)布的版本高出了大約 100 分,而這種改進(jìn)大部分都是由后訓(xùn)練帶來的。
他同時(shí)暗示,在未來用于訓(xùn)練的算力中,OpenAI可能將偏向后訓(xùn)練。他說道:“模型生成的輸出質(zhì)量比網(wǎng)上的大多數(shù)內(nèi)容都要高。因此,讓模型自己思考似乎更有道理,而不僅僅是訓(xùn)練來模仿網(wǎng)絡(luò)上的內(nèi)容。所以,我認(rèn)為從第一性原理上來說,這是有說服力的。我們通過后訓(xùn)練取得了很多進(jìn)步。我希望我們會(huì)繼續(xù)推動(dòng)這種方法,并且可能會(huì)增加投入到后訓(xùn)練中的計(jì)算力。”
針對(duì)GPT-4o強(qiáng)大的多模態(tài)能力,英偉達(dá)高級(jí)研究科學(xué)家Jim Fan發(fā)表長文表示,從技術(shù)角度來看,這需要對(duì)標(biāo)記化和架構(gòu)進(jìn)行一些新的研究,但總體上是一個(gè)數(shù)據(jù)和系統(tǒng)優(yōu)化問題。
在Jim Fan看來,GPT-4o很可能是GPT-5的一個(gè)早期訓(xùn)練點(diǎn),但訓(xùn)練尚未完成。從商業(yè)角度上,他認(rèn)為,“GPT-4o的定位透露出OpenAI某種不安全感,在谷歌開發(fā)者大會(huì)之前(發(fā)布GPT-4o),(意味著)OpenAI寧愿超越我們對(duì)GPT-4.5的心理預(yù)期,也不愿因?yàn)檫_(dá)不到對(duì)GPT-5的極高期望而令人失望。這是一個(gè)聰明的舉措,可以爭取更多時(shí)間。”目前,業(yè)界廣傳GPT-5將在年底發(fā)布。
Jim Fan的觀點(diǎn)與一些業(yè)內(nèi)分析不謀而合。分析認(rèn)為,OpenAI選擇此時(shí)發(fā)布GPT-4o,是為了在競爭對(duì)手尤其是谷歌不斷發(fā)起挑戰(zhàn)的情況下,繼續(xù)保持領(lǐng)先地位。
“宮斗”半年后,OpenAI“保衛(wèi)人類”的團(tuán)隊(duì)“分崩離析”,年初至今公司已有9人離職
在“宮斗”半年后,OpenAI“保衛(wèi)人類”的團(tuán)隊(duì)分崩離析。不僅首席科學(xué)家伊利亞·蘇茨克沃(Ilya Sutskever)和他的親信詹·萊克(Jan Leike)在本周雙雙離職,他們共同領(lǐng)導(dǎo)的“超級(jí)智能對(duì)齊團(tuán)隊(duì)(AI風(fēng)險(xiǎn)團(tuán)隊(duì))”也在周五被證實(shí)解散。
美東時(shí)間5月14日(周二),OpenAI宣布其首席科學(xué)家兼聯(lián)合創(chuàng)始人伊利亞·蘇茨克沃將離職,他的職位將由研究總監(jiān)雅各布·帕喬奇(Jakub Pachocki)取代。
在去年11月OpenAI的“宮斗”風(fēng)波結(jié)束后,蘇茨克沃就鮮有露面,公司董事會(huì)調(diào)整后也未有關(guān)于其職務(wù)的消息。在OpenAI最新發(fā)布的GPT-4o主頁上,蘇茨克沃的名字出現(xiàn)在了“其他領(lǐng)導(dǎo)者”欄。
蘇茨克沃也在X平臺(tái)上發(fā)推宣布了辭職決定,并附上一張照片,畫面中,他和繼任者帕可斯基、聯(lián)合創(chuàng)始人雷格·布洛克曼、首席執(zhí)行官阿爾特曼,以及首席技術(shù)官米拉·穆拉蒂一字排開,成為這段歷史時(shí)刻的紀(jì)念。
至于接下來的安排,蘇茨克沃在其X推文中稱他會(huì)開發(fā)一個(gè)全新有意義的項(xiàng)目,適當(dāng)?shù)臅r(shí)候就會(huì)披露更多細(xì)節(jié)。有人猜測,他可能會(huì)加入馬斯克的xAI,雖然有戲劇性,但也不排除可能性。另有不少人猜測,其新項(xiàng)目還是與ChatGPT等生成式AI產(chǎn)品有關(guān),而且可能是一個(gè)開源項(xiàng)目,畢竟他是這個(gè)領(lǐng)域宗師級(jí)人物。
蘇茨克沃1985年出生于蘇聯(lián),成長于以色列,會(huì)俄語、希伯來語和英語。在多倫多大學(xué)求學(xué)期間,他師從“現(xiàn)代人工智能之父”杰弗里·辛頓,并與其合作開發(fā)了AlexNet,該神經(jīng)網(wǎng)絡(luò)的誕生極大地推動(dòng)了深度學(xué)習(xí)技術(shù)在圖像識(shí)別領(lǐng)域的應(yīng)用。
2015年,在馬斯克力邀之下,蘇茨克沃加入OpenAI,成為初創(chuàng)團(tuán)隊(duì)的一員,在ChatGPT語言模型和Dall-E圖像生成器的研發(fā)過程中扮演了關(guān)鍵角色。《紐約時(shí)報(bào)》報(bào)道稱,蘇茨克沃加入OpenAI后參與了涉及神經(jīng)網(wǎng)絡(luò)的人工智能突破,這項(xiàng)技術(shù)在過去十年中推動(dòng)了該領(lǐng)域的顯著進(jìn)步。2023年,蘇茨克沃入選2023年度十大科學(xué)人物榜單(Nature's 10),被Nature評(píng)價(jià)為“ChatGPT和其他改變社會(huì)的人工智能系統(tǒng)的先驅(qū)”。
不過,在去年10月份罕見接受《麻省理工科技評(píng)論》的專訪時(shí),蘇茨克沃曾表示,他不打算構(gòu)建下一個(gè) GPT 或圖像生成模型 DALL-E,而是打算弄清楚如何阻止超級(jí)人工智能變得不受控制。作為未來主義的信徒,他認(rèn)為這種仍處于假設(shè)的未來技術(shù)終會(huì)出現(xiàn)。
蘇茨克沃宣布離職后幾個(gè)小時(shí),Ily的親信、OpenAI超級(jí)對(duì)齊團(tuán)隊(duì)負(fù)責(zé)人之一詹·萊克(Jan Leike)也在X平臺(tái)上發(fā)文宣布辭職。此外,本周五,OpenAI證實(shí),由蘇茨克沃和萊克共同領(lǐng)導(dǎo)的“超級(jí)智能對(duì)齊團(tuán)隊(duì)”已經(jīng)解散。此后,該團(tuán)隊(duì)的研究工作將被整合到OpenAI的其他研究小組中。
2023年9月,萊克被《時(shí)代》雜志評(píng)為人工智能領(lǐng)域100位最具影響力人物之一。萊克周五在X上公開透露了他離職的部分原因。他與OpenAI高層在公司的核心優(yōu)先事項(xiàng)上存在長期分歧。團(tuán)隊(duì)在推動(dòng)其研究項(xiàng)目和爭取計(jì)算資源時(shí)遇到了重大阻礙。構(gòu)建超人智能機(jī)器本身就是一項(xiàng)危險(xiǎn)的事情,OpenAI肩負(fù)全人類的重任。但在過去幾年里,安全文化和流程都讓位于產(chǎn)品。
馬斯克針對(duì)OpenAI超級(jí)對(duì)齊團(tuán)隊(duì)已經(jīng)解散這一消息評(píng)價(jià)稱:“這顯示安全并不是OpenAI的首要任務(wù)。”
蘇茨克沃和萊克的先后離職只是OpenAI團(tuán)隊(duì)近期動(dòng)蕩的一部分?!睹咳战?jīng)濟(jì)新聞》記者根據(jù)OpenAI的公開聲明和媒體報(bào)道梳理發(fā)現(xiàn),今年以來,OpenAI已有9名高管和員工離職。
據(jù)The Information報(bào)道,OpenAI人力部副總裁戴安·尹(Diane Yoon)和非營利和戰(zhàn)略計(jì)劃負(fù)責(zé)人克里斯·克拉克(Chris Clark)幾周前辭職。同在4月,研究人員Leopold Aschenbrenner和Pavel Izmailov也已經(jīng)離開OpenAI,他們此前都曾在超級(jí)對(duì)齊團(tuán)隊(duì)工作過。2月,OpenAI創(chuàng)始成員之一、公司AI 技術(shù)研究員安德烈·卡帕蒂(Andrej Karpathy)也宣布離職,以專注于個(gè)人項(xiàng)目。
澤連斯基簽署罪犯動(dòng)員法案
據(jù)央視新聞,烏克蘭媒體當(dāng)?shù)貢r(shí)間5月17日?qǐng)?bào)道稱,烏克蘭總統(tǒng)澤連斯基當(dāng)天簽署了罪犯動(dòng)員法案。
當(dāng)?shù)貢r(shí)間5月8日,烏克蘭最高拉達(dá)(議會(huì))以279票贊成通過了罪犯動(dòng)員法案。報(bào)道稱,該法案將對(duì)直接參與保衛(wèi)國家獨(dú)立和領(lǐng)土完整的服刑人員實(shí)行有條件提前釋放。那些因輕罪入獄的囚犯將可在烏武裝部隊(duì)服役,但犯有謀殺、強(qiáng)奸、性暴力或危害國家安全罪的人將不會(huì)被動(dòng)員。
俄羅斯國防部當(dāng)?shù)貢r(shí)間16日通報(bào)稱,過去一天,俄軍摧毀烏軍坦克、裝甲車、美制M777榴彈炮、無人艇倉庫等烏軍裝備和設(shè)施。俄防空部隊(duì)擊落烏軍3架米格-29戰(zhàn)機(jī),擊毀烏軍25架無人機(jī)和多枚戰(zhàn)術(shù)導(dǎo)彈、反輻射導(dǎo)彈、制導(dǎo)炸彈和各類型火箭彈。
蘋果據(jù)稱2025年將推出一款更薄的iPhone
當(dāng)?shù)貢r(shí)間5月17日,據(jù)外媒The Information援引三名知情人士,蘋果公司正在開發(fā)一款更輕薄的iPhone手機(jī),預(yù)計(jì)將于2025年推出。
報(bào)道稱,這款更薄版本的iPhone目前在蘋果公司內(nèi)部被稱為iPhone 17 Slim,代號(hào)為D23,定價(jià)可能比蘋果iPhone Pro Max更高。Pro Max目前已經(jīng)是蘋果定價(jià)最貴的機(jī)型,起售價(jià)在1200美元。
消息人士預(yù)計(jì),該款新機(jī)型將于2025年9月與iPhone 17系列一起推出。了解蘋果開發(fā)流程的內(nèi)部人士暗示,iPhone Plus型號(hào)可能會(huì)被淘汰,為iPhone 17 Slim讓路。此外,蘋果可能還計(jì)劃在2025年春季推出一款更便宜的iPhone,作為iPhone SE的后續(xù)產(chǎn)品。
蘋果正在努力應(yīng)對(duì) iPhone 銷量下滑的問題,截至3月份的最近一個(gè)季度,iPhone 銷量與去年同期相比下降了11%。更薄 iPhone 可能會(huì)重新激發(fā)人們對(duì)該產(chǎn)品的興趣。
馬斯克宣布腦機(jī)試驗(yàn)開始招募第二名患者
當(dāng)?shù)貢r(shí)間周五,腦機(jī)接口公司Neuralink的創(chuàng)始人埃隆·馬斯克宣布,繼年初首個(gè)參與該公司腦機(jī)設(shè)備植入實(shí)驗(yàn)的患者手術(shù)成功100天后,正式開始招募第二個(gè)接受腦機(jī)植入的患者。
Neuralink開發(fā)的N1 Implant需要通過手術(shù)放置在使用者頭骨中,使植入者光憑“意念”就能操作電腦、手機(jī)。目前這類設(shè)備主要應(yīng)用在癱瘓患者身上,馬斯克也曾表示,希望將適應(yīng)癥擴(kuò)展至聽力、視力受損人群,并最終幫助“人類與人工智能結(jié)合”。
首試者諾蘭·阿博(Noland Arbaugh)表示,他現(xiàn)在每天要使用這款植入物10-12個(gè)小時(shí),只有在設(shè)備充電或者他睡覺時(shí)才會(huì)讓它休息。
根據(jù)諾蘭與Neuralink的協(xié)議,他會(huì)在植入設(shè)備后1年內(nèi)向公司提供數(shù)據(jù),之后他們會(huì)討論下一步是否要停用或者移除設(shè)備。
但諾蘭表示,他更想要保留這個(gè)設(shè)備,并在下一代產(chǎn)品準(zhǔn)備好時(shí)升級(jí)腦子里的接口。諾蘭表示:“我打賭下一個(gè)得到這東西的人會(huì)和我有一樣的感覺,一旦你嘗試使用它,就停不下來了。這款設(shè)備真是讓我震驚。”
外資抄底中國資產(chǎn),《大空頭》原型繼續(xù)看漲中概股
當(dāng)?shù)貢r(shí)間周三,在美國證監(jiān)會(huì)網(wǎng)站刊登的13F報(bào)告顯示,華爾街知名基金經(jīng)理、《大空頭》原型邁克爾•巴里(Michael Burry)在今年第一季度繼續(xù)加倍押注京東和阿里等中概股。
報(bào)告顯示,截至3月31日,巴里增持了16萬股京東股票和5萬股阿里股票,使得這兩只股票繼續(xù)成為其前兩大持倉,分別占其股票投資組合的約9.53%和8.74%。
今年初以來,隨著國內(nèi)經(jīng)濟(jì)復(fù)蘇、政策刺激以及眾多中概股估值降至低位,不少海外投資者對(duì)于中概股的興趣也在持續(xù)增加。
國家外匯管理局披露的最新數(shù)據(jù)顯示,4月境外投資者凈買入境內(nèi)債券、股票分別為1247億元和451億元人民幣。
安進(jìn)小細(xì)胞肺癌治療藥獲FDA批準(zhǔn):能縮小腫瘤 延長壽命
周四(5月17日),美國食品和藥物管理局(FDA)批準(zhǔn)了安進(jìn)公司(Amgen)用于治療肺癌的療法。
Tarlatamab是安進(jìn)研發(fā)的一種雙特異性T細(xì)胞接合劑(BiTE)抗體,靶向DLL3和CD3,作為廣泛期小細(xì)胞肺癌(ES-SCLC)患者的二線治療或后期治療。該藥物將以Imdelltra的名稱被推出。
在臨床試驗(yàn)中,該藥物已被證明可以縮小腫瘤,并幫助小細(xì)胞肺癌患者顯著延長壽命。
免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前核實(shí)。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
記者:文巧 蔡鼎 譚玉涵
編輯:蘭素英 孫宇婷
視覺:劉青彥
排版:譚玉涵
封面圖片來源:x平臺(tái)
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP