每日經(jīng)濟新聞

要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

OpenAI推出新模型，讓GPT-4幫人類訓(xùn)練GPT-4！OpenAI與《時代》雜志“聯(lián)手”，訓(xùn)練其最先進AI模型

每日經(jīng)濟新聞 2024-06-28 07:15:59

每經(jīng)編輯杜宇

美東時間6月27日周四，OpenAI公布，其研究人員訓(xùn)練了一個基于GPT-4的模型，它被稱為CriticGPT，用于捕捉ChatGPT代碼輸出中的錯誤。簡單來說就是，CriticGPT讓人能用GPT-4查找GPT-4的錯誤。它可以寫出使用者對ChatGPT響應(yīng)結(jié)果的批評評論，從而幫助人類訓(xùn)練者在RLHF期間發(fā)現(xiàn)錯誤。

OpenAI發(fā)現(xiàn)，如果通過CriticGPT獲得幫助審查ChatGPT編寫的代碼，人類訓(xùn)練師的審查效果比沒有獲得幫助的人強60%。OpenAI稱，正著手將類似CriticGPT的模型集成到旗下RLHF標記管道中，為自己的訓(xùn)練師提供明確的AI幫助。

OpenAI稱，因為沒有更好的工具，所以人們目前難以評估高級的AI系統(tǒng)的表現(xiàn)。而CriticGPT意味著，OpenAI向能夠評估高級AI系統(tǒng)輸出的目標邁進了一步。

OpenAI舉了一個例子，如下圖所示，對ChatGPT提出一個用Python編寫指定函數(shù)的任務(wù)，對于ChatGPT根據(jù)要求提供的代碼，CriticGPT點評了其中一條指令，提議換成效果更好的。

OpenAI稱，CriticGPT的建議并不是全都正確無誤，但OpenAI的人員發(fā)現(xiàn)，相比沒有這種AI的幫助，有了它，訓(xùn)練師可以發(fā)現(xiàn)更多模型編寫答案的問題。

此外，當(dāng)人們使用CriticGPT時，這種AI模型會增強他們的技能，從而得出的批評結(jié)論比單單人類訓(xùn)練師做的更全面，并且比AI模型單獨工作時產(chǎn)生的幻覺錯誤更少。

OpenAI 在開發(fā) CriticGPT 過程中識別出幾個關(guān)鍵的挑戰(zhàn)：

訓(xùn)練方法的改進需求：目前模型主要基于簡短的答案進行訓(xùn)練，這限制了它們處理長且復(fù)雜問題的能力。需要探索新的訓(xùn)練策略來提升模型對復(fù)雜任務(wù)的理解。

幻覺現(xiàn)象的糾正：AI 模型有時會生成不準確或虛構(gòu)的信息，這被稱為幻覺。同時，訓(xùn)練師在識別這些錯誤時也可能出錯，這要求模型和訓(xùn)練師的準確性都需要提高。

錯誤識別的全面性：現(xiàn)實中的錯誤可能分布在答案的多個部分，而現(xiàn)有模型通常只能識別出一個錯誤。未來的工作需要使模型能夠識別并糾正分散在不同地方的錯誤。

評估復(fù)雜性的局限：即使在模型的輔助下，專家在面對極其復(fù)雜的任務(wù)或響應(yīng)時也可能難以做出準確的評估，這顯示了 AI 在處理極端復(fù)雜情況時的限制。

此外，OpenAI 強調(diào)了為了更有效地管理和協(xié)調(diào)日益復(fù)雜的 AI 系統(tǒng)，需要更先進的工具。他們通過在 GPT-4 上應(yīng)用 RLHF 方法，發(fā)現(xiàn)了一種可能幫助生成更優(yōu)質(zhì) RLHF 數(shù)據(jù)的方法。OpenAI 計劃擴展這項研究，并將其實際應(yīng)用，以提高 AI 系統(tǒng)的整體性能和穩(wěn)定性。

圖片來源：視覺中國-VCG31N2008743681

另外值得注意的是，當(dāng)?shù)貢r間6月28日，《時代》雜志與OpenAI宣布，兩家公司達成了一項多年內(nèi)容授權(quán)協(xié)議和戰(zhàn)略合作伙伴關(guān)系。該協(xié)議允許OpenAI將這家出版商的內(nèi)容引入ChatGPT，并幫助訓(xùn)練其最先進的人工智能（AI）模型。

據(jù)新聞稿介紹，OpenAI可以通過這筆交易訪問《時代》過去100多年的檔案和文章，以訓(xùn)練其AI模型，并在其面向消費者的產(chǎn)品（如ChatGPT）中用于回復(fù)用戶的詢問。

OpenAI使用《時代》雜志的內(nèi)容時會注明引用并鏈接原始來源。作為協(xié)議的一部分，《時代》雜志將可以使用OpenAI的技術(shù)，以便為其受眾“開發(fā)新產(chǎn)品”。

《時代》雜志首席運營官馬克·霍華德表示，在上百年的歷史中，《時代》一直在擁抱創(chuàng)新，以確保其值得信賴的新聞報道與技術(shù)一起發(fā)展。

霍華德強調(diào)，而與OpenAI的合作有助于推進《時代》的使命，即在全球范圍內(nèi)擴大對可信信息的獲取，同時繼續(xù)采用創(chuàng)新的新方式將《時代》的新聞帶給全球的受眾。

OpenAI的首席運營官Brad Lightcap聲稱，兩家公司的合作旨在利用AI技術(shù)幫助人們更便捷地獲取新聞，并確保提供正確的信源，從而支持高質(zhì)量的新聞報道。

與此同時，OpenAI還在與數(shù)十家出版商洽談內(nèi)容授權(quán)協(xié)議。上個月，OpenAI和新聞集團也達成了類似的合作關(guān)系。它將允許OpenAI訪問新聞集團旗下媒體的當(dāng)前和存檔文章，包括《華爾街日報》《MarketWatch》《巴倫周刊》《紐約郵報》等。

美國八家新聞機構(gòu)4月底在紐約聯(lián)邦法院對OpenAI、微軟提起訴訟，指控微軟的Copilot和OpenAI的ChatGPT非法復(fù)制了數(shù)百萬篇文章來訓(xùn)練AI模型。這些新聞機構(gòu)要求OpenAI和微軟賠償它們的損失，并停止進一步侵犯版權(quán)行為。

雖然沖突和分歧仍然存在，但目前的趨勢是，越來越多的新聞出版商選擇與OpenAI等AI公司建立合作關(guān)系，而不是提起訴訟。

每日經(jīng)濟新聞綜合公開資料

封面圖片來源：視覺中國-VCG31N2008743681

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán)，嚴禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

Ai OpenAI

上一篇文章

湖南省氣象臺發(fā)布大霧黃色預(yù)警

返回每經(jīng)網(wǎng)首頁

下一篇文章

首批三只港股央企紅利主題基金成立

相關(guān)文章

熱文精選

點擊排行

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2025 每日經(jīng)濟新聞報社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會征信網(wǎng)

兒童色情信息舉報專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報中心

四川省互聯(lián)網(wǎng)舉報中心

中國互聯(lián)網(wǎng)舉報中心

每日經(jīng)濟新聞互聯(lián)網(wǎng)不良與違法信息舉報中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號：蜀ICP備19004508號-3 川公網(wǎng)安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人在线免费