每日經(jīng)濟新聞 2024-05-13 18:13:31
◎ OpenAI線上直播即將于當(dāng)?shù)貢r間5月13日上午10點(北京時間5月14日凌晨1點)開始。據(jù)外媒報道,活動預(yù)計有兩大亮點:一是能更好理解圖片和音頻的語音助手,二是ChatGPT或內(nèi)置語音通話能力。
每經(jīng)記者 文巧 每經(jīng)編輯 蘭素英
從今夜開始,OpenAI線上直播、谷歌2024年I/O開發(fā)者大會、微軟Build年度開發(fā)者大會、英偉達一季報以及蘋果年度開發(fā)者大會將在未來的一個月悉數(shù)上演。
當(dāng)?shù)貢r間5月13日上午10點(北京時間5月14日凌晨1點),OpenAI線上直播將率先登場,展示ChatGPT新功能和升級版GPT-4,該公司已經(jīng)在官網(wǎng)發(fā)布預(yù)約頁面,但相關(guān)細(xì)節(jié)尚未公布。
圖片來源:OpenAI
The Information援引消息人士稱,OpenAI準(zhǔn)備在活動中展示能夠使用聲音和文本與人交談以及識別物體和圖像的技術(shù),這一技術(shù)將被整合到萬眾期待的語言助手產(chǎn)品中。
此外,《每日經(jīng)濟新聞》記者在X平臺上注意到,有網(wǎng)友扒出ChatGPT的代碼,顯示其或?qū)⒕邆湔Z音通話能力。有人戲稱,電影《她》中的場景即將走入現(xiàn)實。
外媒此前預(yù)計本次直播會將發(fā)布有關(guān)搜索引擎或GPT-5的消息,但隨后OpenAI首席執(zhí)行官Sam Altman駁斥了這些謠言。隨著谷歌、Meta等競爭對手相繼發(fā)布新的多模態(tài)大模型,外媒報道稱,OpenAI可能會在今年年底前公布GPT-5以期保持領(lǐng)先地位。
盡管OpenAI官網(wǎng)未提供有關(guān)此次直播演示的相關(guān)細(xì)節(jié),但記者經(jīng)過梳理發(fā)現(xiàn),此次活動上有兩大亮點值得期待。
亮點一:語音助手
據(jù)The Information獨家報道,OpenAI準(zhǔn)備在這場即將開始的活動中展示能夠使用聲音和文本與人交談以及識別物體和圖像的技術(shù),并將該技術(shù)整合至一個語音助手產(chǎn)品中。這意味著,這款A(yù)I助手所基于新的多模態(tài)模型能夠更好地理解圖像和音頻。
報道援引知情人士稱,該公司開發(fā)人員已經(jīng)向一些客戶展示了這款A(yù)I助手的其中一些功能,其邏輯推理能力比當(dāng)前的產(chǎn)品更優(yōu)秀。
報道稱,OpenAI首席執(zhí)行官Sam Altman的目標(biāo)是,最終開發(fā)出類似于斯派克•瓊斯電影《她》的虛擬助手,使蘋果Siri等現(xiàn)有語音助手變得更加智能。Altman認(rèn)為,具有視覺和音頻功能的AI助手與智能手機一樣,都有變革性的潛力。理論上,AI助手可以充當(dāng)學(xué)生導(dǎo)師、解決汽車故障等許多角色。
不過,報道稱,該產(chǎn)品目前無法在個人設(shè)備上運行,客戶在短期內(nèi)可以使用基于云的版本來部署或改進功能,例如自動化客戶服務(wù)代理。目前尚不清楚OpenAI何時向其付費客戶提供這些新功能,但它最終計劃將這些新功能納入其聊天機器人ChatGPT免費版本的一部分。
亮點二:ChatGPT將具備通話功能
記者注意到,在X平臺上,一位名叫Ananay Arora的開發(fā)人員發(fā)布了疑是ChatGPT通話相關(guān)代碼的屏幕截圖。他表示,OpenAI可能正在準(zhǔn)備在ChatGPT中內(nèi)置通話功能。
圖片來源:X平臺
此外,Arora還發(fā)現(xiàn)了OpenAI已配置用于實時音頻和視頻通信的服務(wù)器的證據(jù)。
圖片來源:X平臺
基于此,有網(wǎng)友評論猜測,“這是不是意味著ChatGPT能夠主動給我打電話,而不需要我先發(fā)起呼叫?”而這一幕,在電影《她》中就曾出現(xiàn)——AI助手薩曼莎會主動給男主人公打電話。
圖片來源:X平臺
除此之外,Hallid.ai的聯(lián)合創(chuàng)始人indigo在X平臺上預(yù)測稱,GPT-4 的新版應(yīng)該會按照參數(shù)規(guī)模不同分化成多個版本,他同時說道:“GPT-3.5 的歷史使命結(jié)束了,GPT-4的輕量版可以在ChatGPT中免費使用,而且API的價格會大幅下降。”
圖片來源:X平臺
indigo的猜測與OpenAI的目標(biāo)是一致的。據(jù)The Information報道,OpenAI的目標(biāo)正是讓支持前述新功能的AI模型比目前銷售的最先進模型GPT-4 Turbo的運行成本更低。
據(jù)悉,OpenAI今年還計劃發(fā)布一種新的定價模型,如果客戶預(yù)付費,該模型將為客戶提供高達50%的折扣。目前,OpenAI主要提供按需定價,大模型每生成100萬token,向開發(fā)者收取幾美分到120美元不等的費用。
據(jù)悉,提前付款折扣在云計算中很常見——Microsoft Azure、Google Cloud 和 Amazon Web Services的客戶就可以通過提前預(yù)留服務(wù)器容量來降低成本。憑借更靈活的定價,OpenAI可以更好地與競爭對手角逐。
隨著谷歌、Meta等競爭對手相繼發(fā)布新的多模態(tài)大模型,例如Meta在4月份發(fā)布開源模型Llama 3,谷歌在去年12月發(fā)布Gemini,外界猜測,OpenAI即將公布GPT-5以期保持領(lǐng)先地位。此外,近期一系列報道稱,OpenAI也在致力于推出一款網(wǎng)絡(luò)搜索引擎,旨在與谷歌搜索搶奪市場份額。
不過,在此前接受外媒采訪時,Altman表示,OpenAI并不會在本次直播活動中發(fā)布GPT-5,也不會發(fā)布AI搜索引擎。
盡管如此,該公司并未否認(rèn)正在開發(fā)在線搜索產(chǎn)品的傳言。科技媒體Inquirer Tech報道了一個名為“search.chatgpt.com”的域名和SSL認(rèn)證,稱這是與OpenAI在線搜索項目相關(guān)的有力線索。此外,據(jù)報道,該公司可能會在今年年底前公布GPT-5。
盡管OpenAI在AI模型上傾注大量精力,但The Information也表達了對該公司接下來如何創(chuàng)造實際利益的擔(dān)憂。例如,OpenAI曾向開發(fā)人員承諾,到今年第一季度,將能夠通過GPTs構(gòu)建定制聊天機器人來賺錢,但迄今該公司尚未推出一種有效的方式達到目的。
另一方面,外媒報道稱,蘋果接近與OpenAI就下一代iPhone操作系統(tǒng)如何集成ChatGPT達成協(xié)議。然而,OpenAI依然面臨著激烈的競爭:蘋果同時也正在與谷歌進行類似的談判,以期將Gemini應(yīng)用于智能手機中。
此外,Altman還正與蘋果前設(shè)計師Jony Ive合作開發(fā)一款單獨的AI消費設(shè)備。然而,最先進的AI模型規(guī)模十分龐大,意味著目前需要在云端運行,并且需要互聯(lián)網(wǎng)連接才能工作,具有視覺和音頻功能的AI模型可能需要數(shù)月甚至數(shù)年的時間才能變得足夠小以在設(shè)備上運行。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP