每日經濟新聞 2024-05-19 13:12:45
每經編輯 畢陸名
開欄語:《大模界》是每日經濟新聞旗下專注AIGC領域報道的欄目。從本周開始,我們推出子欄目《AIGC行業(yè)周報》,梳理AIGC行業(yè)一周內發(fā)生的重要動態(tài),產品發(fā)布和業(yè)內大咖的最新觀點。
1、OpenAI安全主管離職
5月18日凌晨,OpenAI安全主管、“超級智能對齊團隊”負責人Jan Leike在社交平臺宣布,離開OpenAI。這也是本周三OpenAI聯合創(chuàng)始人兼首席科學家Ilya Sutskever辭職之后,又有一名高管辭職。
Jan Leike在X上公開透露了他離職的部分原因。他的潛臺詞是,他與OpenAI高層在公司的核心優(yōu)先事項上存在長期分歧,最終雙方的分歧已經嚴重到無法調和的地步。團隊在推動其研究項目和爭取計算資源時遇到了重大阻礙,缺乏資源會嚴重影響研究的進度和質量。
2、“超級智能對齊團隊”解散
本周五(當地時間5月17日),OpenAI證實,由Ilya和他的親信Jan Leike共同領導的“超級智能對齊團隊”已經解散。此后,該團隊的研究工作將被整合到OpenAI的其他研究小組中。至此,一度幾乎導致OpenAI分崩離析的宮斗事件終于塵埃落定。
OpenAI首席執(zhí)行官Sam Altman感謝并肯定了Jan Leike在OpenAI的貢獻和領導能力。并表示,未來幾天內會發(fā)表一篇更長的文章,來闡述OpenAI對于產品安全的規(guī)劃和所做的事情。
而現在AI風險團隊解散是公司內部最近出現動蕩的又一證據,也再次引發(fā)了人們對該公司在開發(fā)AI產品時如何平衡速度與安全的質疑。OpenAI章程規(guī)定,必須安全地開發(fā)通用人工智能(AGI),即可以與人類匹敵或超越人類的技術。
3、百度AI轉型:AI First Business戰(zhàn)略下的增長與創(chuàng)新
北京時間5月16日,百度在2024年Q1財報中展示了其凈利潤的同比增長,超出市場預期,彰顯了公司從Internet Centric Business向AI First Business轉型的決心和成果。李彥宏強調,AI技術正在全面重構百度的產品和服務,尤其在搜索業(yè)務上,百度正在通過AI生成的搜索結果和智能體平臺AgentBuilder,提升用戶體驗和商業(yè)效率。百度App的月活用戶持續(xù)增長,智能云業(yè)務實現盈利,文心大模型成為云業(yè)務的重要增長點。此外,百度在自動駕駛領域取得突破,發(fā)布了支持L4級自動駕駛的大模型Apollo ADFM,并推出了價格合理的蘿卜快跑第六代無人車,展現了百度在AI技術應用和商業(yè)化方面的領先地位和未來的增長潛力。
4、智源研究院發(fā)布國內外140+大模型評測結果
北京時間5月17日,智源研究院在大模型評測發(fā)布會上推出了智源評測體系,公布了對國內外140余個開源和商業(yè)閉源的語言及多模態(tài)大模型的全方位能力評測結果。評測從主觀和客觀兩個維度進行,涵蓋簡單理解、知識運用、推理能力等七大能力。結果顯示,在中文語境下,國內頭部語言模型綜合表現接近國際一流水平,但在安全與價值觀對齊方面存在差異。多模態(tài)模型在中文語境下的文生圖能力和文生視頻能力上表現出色,尤其是Sora在視頻生成方面具有明顯優(yōu)勢。智源研究院還首次聯合教育機構進行大模型K12學科測試,發(fā)現模型在綜合學科能力上與學生平均水平有差距,尤其在文理學科和圖表理解能力上。此外,中國傳媒大學智能媒體計算實驗室負責人提出需要系統(tǒng)化構建文生視頻模型的主觀評價體系。智源評測體系旨在促進模型性能優(yōu)化和產業(yè)落地,推動大模型技術應用的有序發(fā)展。
1、OpenAI發(fā)布全能大模型GPT-4o,免費開放Plus功能并提供API
美東時間5月13日周一,OpenAI推出了最新旗艦大模型GPT-4o,該模型不僅免費開放,還具備聽、看、說的能力,能夠實時流暢地進行視頻通話,無延遲地響應,與人類對話反應速度一致。GPT-4o的"o"代表"Omni",即全能,能夠接受文本、音頻和圖像的任意組合作為輸入,并生成相應的輸出。此外,GPT-4o將提供API,價格優(yōu)惠,速度提升,調用次數增加。OpenAI還展示了GPT-4o在實時翻譯、視覺識別等方面的應用,并進行了兩個ChatGPT模型之間的對話演示,展現了其端到端訓練的神經網絡處理語音、文本和圖像的能力。
盡管GPT-4o在圖像識別、情緒判斷、視頻內容分析以及語言翻譯等方面表現出色,在某些特定任務上仍有局限。OpenAI計劃在未來幾周內推出GPT-4o的語音功能alpha版,Plus用戶將優(yōu)先體驗。GPT-4o的演示和體驗揭示了AI在提供情緒價值、模擬人類對話以及多模態(tài)交互方面的潛力,預示著AI技術在日常生活中的應用將更加廣泛和深入。
同時,OpenAI在其ChatGPT平臺推出了一項新功能,允許用戶直接打開數據文件并進行實時交互式數據分析。用戶可以通過Google Drive或Microsoft OneDrive上傳文件,ChatGPT將創(chuàng)建一個交互式表格,支持數據分組、四舍五入等操作,并能夠創(chuàng)建圖表和總結結論。
此外,用戶還可以自定義和下載圖表,以便在演示文稿和文檔中使用。這些新功能預計將在未來幾周內向ChatGPT Plus、團隊和企業(yè)用戶開放。有網友推測,這些新功能背后可能使用了名為ADA V2(GPT-4)的數據分析新模型。OpenAI強調,企業(yè)用戶的數據不會被用于訓練,ChatGPT Plus用戶可以選擇開啟隱私保護功能。
2、谷歌推出Project Astra和Veo模型,與OpenAI的GPT-4o展開競爭
北京時間15日凌晨1點,在OpenAI發(fā)布GPT-4o后,谷歌DeepMind首席執(zhí)行官哈薩比斯推出了名為Project Astra的AI助手,該助手基于Gemini系列模型,旨在提供日常生活幫助,并通過攝像頭直接讀取代碼。此外,谷歌還推出了Veo視頻生成模型,能夠生成最長超過1分鐘的1080p高質量視頻。谷歌進一步將Gemini模型集成到全線產品中,包括谷歌搜索、Android系統(tǒng)、谷歌Photos和谷歌Workspace,顯著提升了AI在搜索、手勢識別搜索、圖片視頻查找以及工作生產力工具中的應用。谷歌還宣布了第六代TPU Trillium,將在今年向云客戶提供,其性能和能效比前代有顯著提升。
3、字節(jié)跳動發(fā)布豆包大模型家族,以低價格和多場景應用為特點
北京時間5月15日,字節(jié)跳動通過其火山引擎首次公開亮相了豆包大模型家族,共9個成員,包括通用模型pro和lite兩個尺寸。這些模型專注于實際應用效果,而非僅僅追求參數規(guī)模和榜單分數。豆包大模型的價格顯著低于行業(yè)標準,旨在實現廣泛的應用和使用?;鹕揭鎻娬{通過大規(guī)模使用量來不斷優(yōu)化模型,其大模型自上線以來,每天處理的token數量高達1200億,生成圖片3000萬張,并在50多個場景中進行實踐和驗證。此外,火山引擎還升級了火山方舟平臺,發(fā)布了扣子專業(yè)版,旨在簡化企業(yè)級AI應用的開發(fā)和落地。
1、Sam Altman:GPT-4o幕后揭秘,GPT-5會很特別
當地時間5月16日,OpenAI首席執(zhí)行官Sam Altman(阿爾特曼)在接受紅點風險投資公司董事LoganBartlett的專訪中,深入討論了GPT-4o多模態(tài)大模型的創(chuàng)新特點,包括其跨文本、視頻、音頻推理的能力,以及低延遲帶來的應用場景拓展。Altman還透露了GPT-5的發(fā)展方向,暗示其將具有類似“虛擬大腦”的功能,幫助用戶處理各種任務。
此外,他表達了對開源大模型領域的認可,并認為編程領域將是未來12個月最有前途的應用程序領域之一。他還提到了AI芯片廠的建設計劃,以及對AGI(人工通用智能)的看法,認為AGI將能夠極大地提高工作效率。
2、甲子光年發(fā)布2024中國AI新風向30條判斷
北京時間5月15日,甲子光年創(chuàng)始人兼CEO張一甲在“2024甲子引力X科技產業(yè)新風向”大會上發(fā)布了關于中國AI發(fā)展的30條判斷。這些判斷涵蓋了AI對生產力變革的影響、AI技術發(fā)展的四個階段(AI生產時代、AI原生時代、AI創(chuàng)生時代、AI文明時代)、以及AI在不同階段的意義和作用。張一甲還討論了AI與人類生產活動的關系、AI對社會經濟結構的深遠影響、以及AI發(fā)展所面臨的挑戰(zhàn)和爭議。此外,她還提出了關于AI是否真的創(chuàng)造新需求、人類與AI之間相互作用的反思性問題,并探討了AI對經濟權重、文化形態(tài)的影響,以及AI與人類文明共生的可能性。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP