每日經(jīng)濟新聞 2025-04-21 07:57:40
每經(jīng)記者 岳楚鵬 每經(jīng)編輯 高涵
|2025年4月21日 星期一|
NO.1 OpenAI新推理模型被曝產(chǎn)生更多幻覺
近日,據(jù)外媒報道,OpenAI發(fā)現(xiàn),o3在PersonQA基準(zhǔn)測試上回答33%的問題時產(chǎn)生了幻覺。這大約是OpenAI之前的推理模型o1和o3 mini幻覺率的兩倍。o4 mini在PersonQA上的表現(xiàn)更差,48%的問題都出現(xiàn)了幻覺。AI研究員Neil Chowdhury認(rèn)為,用于o系列模型的強化學(xué)習(xí)可能會放大幻覺問題。
點評:OpenAI的o3模型幻覺率,較前代模型翻倍,引發(fā)市場對AI可靠性的擔(dān)憂。這可能影響投資者對AI技術(shù)公司的信心,進而對科技板塊產(chǎn)生壓力。
NO.2 全球首個人形機器人半程馬拉松勝利收官
近日,全球首個人形機器人半程馬拉松在北京勝利收官。21個人形機器人參加了此次比賽,北京人形機器人創(chuàng)新中心自研的全尺寸人形機器人“天工Ultra”奪冠,總耗時2時40分,人類選手的獲勝時間為1小時2分。
點評:這一事件不僅驗證了人形機器人在長時間運動中的穩(wěn)定性,也推動了相關(guān)產(chǎn)業(yè)鏈的發(fā)展。
NO.3 微軟CTO:我不相信通用智能體理論
近日,微軟CTO兼AI執(zhí)行副總裁Kevin Scott在訪談中表示,他不認(rèn)同那種 “一個智能體搞定一切” 的理論,未來將是許多智能體。Scott表示:“產(chǎn)品經(jīng)理很可能得成為某個領(lǐng)域的專家,比如深入了解醫(yī)學(xué)、藥物研發(fā)、早期風(fēng)險投資等領(lǐng)域,他們需要深入了解這些領(lǐng)域的特點,幫助建立反饋閉環(huán),讓協(xié)助人們完成任務(wù)的Agent能夠更好地工作。有點像產(chǎn)品經(jīng)理和用戶共同教會Agent如何更好地協(xié)助人們完成任務(wù)。”
點評:微軟CTO Kevin Scott認(rèn)為未來將由眾多特定領(lǐng)域的智能體協(xié)作完成任務(wù),而非單一全能智能體。這預(yù)示著AI將更加垂直化、專業(yè)化,推動各行業(yè)深度應(yīng)用AI技術(shù)。
NO.4 Meta旗下APP禁用蘋果AI功能
近日,據(jù)外媒報道,蘋果最新的Apple Intelligence功能無法在Meta旗下的Facebook、Instagram、WhatsApp和Threads上使用。據(jù)報道,用戶在上述應(yīng)用中無法使用Apple Intelligence的寫作工具和自定義表情符號生成器Genmoji,這些功能被Meta自己的Meta AI所取代。
點評:Meta全面禁用蘋果Apple Intelligence功能,凸顯兩大科技巨頭在AI領(lǐng)域的競爭加劇。
NO.5 Perplexity AI被曝打算將AI助手集成到三星和摩托羅拉手機中
近日,據(jù)外媒援引知情人士透露,Perplexity AI正在與三星討論將其AI助手集成到三星的手機設(shè)備上,并且Perplexity AI已經(jīng)與摩托羅拉達(dá)成了類似的協(xié)議。知情人士表示,與三星的談判尚處于初期階段,而與摩托羅拉的合作將于本月宣布。摩托羅拉將于4月24日在紐約舉辦一場產(chǎn)品發(fā)布會,計劃就此次合作進行討論。
點評:Perplexity AI正積極拓展其AI助手在智能手機領(lǐng)域的應(yīng)用,與三星的洽談及與摩托羅拉的合作,標(biāo)志著其技術(shù)獲得頭部廠商認(rèn)可。若合作達(dá)成,將提升Perplexity AI的市場份額和品牌影響力。
免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請核實。據(jù)此操作,風(fēng)險自擔(dān)。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP