AIGC開(kāi)放社區(qū) 2024-11-14 12:04:34
彭博今天消息,OpenAI正準(zhǔn)備推出一款代號(hào)為“Operator”的全新AI Agent產(chǎn)品,可以自動(dòng)執(zhí)行各種復(fù)雜操作,包括編寫(xiě)代碼、預(yù)訂旅行、自動(dòng)電商購(gòu)物等。
根據(jù)內(nèi)部員工爆料,OpenAI領(lǐng)導(dǎo)層預(yù)計(jì)將在2025年1月發(fā)布該產(chǎn)品,同時(shí)會(huì)為開(kāi)發(fā)人員開(kāi)放API接口。
彭博表示,OpenAI一直在進(jìn)行幾個(gè)與智能體相關(guān)的研究項(xiàng)目。其中一位人士表示,最接近完成的將是一個(gè)在網(wǎng)絡(luò)瀏覽器中執(zhí)行任務(wù)的通用工具。
OpenAI這一計(jì)劃的發(fā)布,是整個(gè)行業(yè)向智能體推進(jìn)的一部分。最近微軟、谷歌、Anthropic都相繼發(fā)布了功能強(qiáng)大的AI Agent。
尤其是Anthropic發(fā)布的“Computer Use”直接顛覆了人機(jī)交互,通過(guò)API開(kāi)發(fā)者可以讓Claude像人類一樣使用計(jì)算機(jī)控制鼠標(biāo)、鍵盤(pán),包括查看屏幕、移動(dòng)光標(biāo)、點(diǎn)擊按鈕和輸入文本等操作。
例如,用戶可以讓Claude去搜索網(wǎng)頁(yè)上的信息、在電子表格中填寫(xiě)數(shù)據(jù);或者打開(kāi)軟件進(jìn)行特定的操作;也能協(xié)助開(kāi)發(fā)人員執(zhí)行重復(fù)性任務(wù)、測(cè)試代碼等,整個(gè)流程Claude會(huì)根據(jù)指令自動(dòng)執(zhí)行相應(yīng)的操作。
目前,Computer use主要依靠API來(lái)驅(qū)動(dòng)自動(dòng)化指令,當(dāng)開(kāi)發(fā)者通過(guò)API向Claude發(fā)送指令時(shí),Claude會(huì)運(yùn)用其自然語(yǔ)言處理能力解析指令。其內(nèi)部語(yǔ)言模型會(huì)對(duì)指令文本進(jìn)行詞法、句法和語(yǔ)義分析,例如,對(duì)于“使用計(jì)算機(jī)中的數(shù)據(jù)填寫(xiě)在線表格”這樣的指令,Claude會(huì)識(shí)別出關(guān)鍵動(dòng)作是填寫(xiě)表格以及數(shù)據(jù)來(lái)源是計(jì)算機(jī)中的數(shù)據(jù)。
這一過(guò)程類似它在處理文本生成任務(wù)時(shí)對(duì)語(yǔ)義的理解,只是此時(shí)語(yǔ)義重點(diǎn)在于計(jì)算機(jī)操作。會(huì)基于預(yù)訓(xùn)練過(guò)程中學(xué)到的語(yǔ)言模式和知識(shí),將指令意圖映射到對(duì)應(yīng)的計(jì)算機(jī)操作概念上,預(yù)訓(xùn)練的知識(shí)包括常見(jiàn)的計(jì)算機(jī)操作術(shù)語(yǔ)、軟件功能描述等,以便準(zhǔn)確把握開(kāi)發(fā)者希望它執(zhí)行的操作。
而OpenAI在明年發(fā)布的“Operator”很可能會(huì)在Computer use的基礎(chǔ)之上進(jìn)行大幅度創(chuàng)新和應(yīng)用簡(jiǎn)化,擴(kuò)大AI Agent的使用范圍和應(yīng)用場(chǎng)景。
封面圖片來(lái)源:視覺(jué)中國(guó)-VCG31N2008743681
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP