每日經(jīng)濟新聞

要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

OpenAI為節(jié)約成本偷工減料？史上最強大模型GPT-4“變笨”引發(fā)全網(wǎng)討論，輸出質(zhì)量被質(zhì)疑明顯下降

每日經(jīng)濟新聞 2023-06-03 11:06:31

◎OpenAI官方開發(fā)者推廣大使回應稱，GPT-4自從3月14日發(fā)布以來沒有發(fā)生改動。

每經(jīng)記者蔡鼎每經(jīng)編輯譚玉涵

如今距離OpenAI于3月中旬推出其最新版本的大型語言模型GPT-4已經(jīng)有近3個月的時間。這段時間內(nèi)，盡管全球資本市場對人工智能、大模型和算力的炒作此起彼伏，也有人稱贊GPT-4這個版本強大的能力，但卻很少有人質(zhì)疑GPT-4是否真的比此前更早期的版本強大。

近期，網(wǎng)上對GPT-4是否出現(xiàn)退化的質(zhì)疑聲開始涌現(xiàn)出來，越來越多的網(wǎng)友開始表示，GPT-4對復雜程度相似的問題處理結(jié)果甚至還不如它的前身GPT-3或GPT-3.5。面對網(wǎng)友的大量質(zhì)疑，OpenAI官方開發(fā)者推廣大使回應稱，GPT-4處于靜止狀態(tài)，且自3月 14日發(fā)布以來沒有做過改動。

可能突破萬億參數(shù)的GPT-4，被OpenAI“狂吹”

根據(jù)OpenAI自己的說法，GPT-3擁有1750億個參數(shù)，但GPT-4的規(guī)?？赡軙_到數(shù)千億個參數(shù)，甚至可能會突破萬億級別。這一規(guī)模的提升將有助于提高模型的表現(xiàn)力和泛化能力，使其更能適應各種語言任務，同時也意味著GPT-4接受了更多的數(shù)據(jù)訓練，模型文件中有更多的權(quán)重（參數(shù)），這也使得它的運行成本更高。

此外，GPT-4可以更準確地解決人們的難題，多模態(tài)的GPT-4還可以生成、編輯具有創(chuàng)意性或技術性的文章，在高級推理方面的表現(xiàn)超過其前身。當然，正如大家所猜測的那樣，微軟New Bing的聊天功能確實基于GPT-4。OpenAI稱，該模型“比以往任何時候都更具創(chuàng)造性和協(xié)作性”，“可以更準確地解決難題”。它可以解析文本和圖像輸入，盡管它只能通過文本進行響應。

官方表示，GPT-4錯誤答案更少，而且也會減少偏離話題的可能，也盡可能不會再談論禁忌話題，甚至在許多標準化測試中比人類表現(xiàn)得都要更好一些。

例如，GPT-4在模擬律師考試的成績在考生中排名前10%左右，在SAT閱讀考試中排名前7%左右，在SAT數(shù)學考試中排名前11%左右。相比之下，GPT-3.5在律師考試中的得分一般都是倒數(shù)10%左右。當然，它們考個研究生還是沒問題的。

圖片來源：OpenAI

不少業(yè)內(nèi)人士也對GPT-4的未來應用前景表示看好，稱GPT-4的出現(xiàn)將進一步推動AI語言模型領域的發(fā)展。作為下一代AI語言模型，GPT-4將會在各方面都得到進一步的改善，包括語言理解、生成、多語種支持等等。同時，GPT-4也將會在各個應用場景中得到廣泛應用，為各個行業(yè)帶來更加高效和智能的解決方案。

有網(wǎng)友4月份就對GPT-4是否退化發(fā)出質(zhì)疑

那么，GTP-4真的如OpenAI自己所稱的那樣更強大嗎？

就在美東時間本周早些時候，Ycombinator上已有網(wǎng)友提出質(zhì)疑，稱“（GPT-4）確實比以前快很多，但它的輸出質(zhì)量更像是GPT-3.5++。GPT-4產(chǎn)生了更多的bug代碼，答案也缺乏深度和分析，總體感覺上比以前要糟糕很多。”

圖片來源：Ycombinator

在上述網(wǎng)友的帖子下方，另一名網(wǎng)友回復稱，“是的。在更新之前，GPT（的上一個版本）能毫不費力地解決相當復雜的編程問題，并對非編程問題給出非常微妙且像是經(jīng)過深思熟慮的答案。如今，GPT-4只能修改一個10行CSS模塊中的兩行，并再次給出這修改后的10行模塊，不僅感到非常吃力，而且給出的答案中有些內(nèi)容毫無關系……”

還有網(wǎng)友表示，“OpenAI的（最新）模型給我的感覺是100%被削弱了。幾個月前我用它（的早期版本）解決了非常復雜的問題（例如編寫一個最小的PDF解析器示例），但今天你會因為問了這么復雜的任務被GPT-4‘責備’。”這名網(wǎng)友最后還稱，他已經(jīng)決定取消訂閱他的OpenAI會員資格。

圖片來源：Ycombinator

在推特上，有網(wǎng)友稱把GPT-4的3小時25條對話額度一口氣用完了，都沒能解決自己的代碼問題，最后無奈切換回了GPT-3.5。

圖片來源：推特

《每日經(jīng)濟新聞》記者還注意到，網(wǎng)上關于GPT-4是否退化的討論，其實在1個月前就已經(jīng)有了。當時有網(wǎng)友在美國版天涯+貼吧平臺Reddit上，對GPT-4是否“變笨”發(fā)出質(zhì)疑。這名當時網(wǎng)友稱，“在過去幾天里，我經(jīng)歷了GPT-4性能的明顯下降。它的推理能力已經(jīng)退化到GPT-3的水平，而且它正在努力完成上個月剛剛為我完成的任務。今晚的性能還是最糟糕的。這是怎么回事？”

圖片來源：Reddit

在OpenAI的官方開發(fā)者論壇，有網(wǎng)友在4月30日就發(fā)帖稱，“一周前，我用GPT4為MS飛行模擬器創(chuàng)建了一個非常簡單的C#應用程序。這太神奇了，我只（手動）更正了一次。今天我用了同樣的提示詞，但經(jīng)過多次修改后GPT-4還是不能正常使用。”

圖片來源：OpenAI

一時間，關于“GPT-4退化了”、“OpenAI為了節(jié)省成本開始偷工減料”等質(zhì)疑聲開始在Ycombinator、Reddit和推特等平臺快速蔓延開來。速度如此之快，就連OpenAI官方的開發(fā)者推廣大使Logan Kilpatrick都出面來公開回應網(wǎng)友的質(zhì)疑：“API不會在沒有我們通知您的情況下更改。”

圖片來源：推特

在上述推文下方，Logan還回復了網(wǎng)友一些問題，他稱，GPT-4自從3月14日發(fā)布以來未發(fā)生改動。他還表示，GPT-4對于一些提示詞給出的回答內(nèi)容不一致，是由于大模型本身不穩(wěn)定。不過，針對網(wǎng)頁版GPT-4是否被降級過的追問，均未得到其本人的正面回答。

圖片來源：推特

另據(jù)監(jiān)管機構(gòu)NewsGuard的專家分析，OpenAI最新版本的GPT-4大型語言模型在輸出信息方面，確實比它的前身GPT-3.5還要糟糕。在今年3月份發(fā)布的報告中，NewsGuard就指出，GPT-4不僅在其研究人員的提示下回答了完全虛假的新聞敘述，而且甚至比GPT-3.5回答的內(nèi)容更差。

封面圖片來源：視覺中國

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán)，嚴禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

GPT Ai OpenAI

上一篇文章

重磅！國產(chǎn)首款帶狀皰疹疫苗正式上市！適用人群擴齡至40歲及以上

返回每經(jīng)網(wǎng)首頁

下一篇文章

迪士尼落子武漢？上海迪士尼度假區(qū)回復：這是假新聞！

相關文章

熱文精選

點擊排行

歡迎關注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

關注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2025 每日經(jīng)濟新聞報社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡社會征信網(wǎng)

兒童色情信息舉報專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報中心

四川省互聯(lián)網(wǎng)舉報中心

中國互聯(lián)網(wǎng)舉報中心

每日經(jīng)濟新聞互聯(lián)網(wǎng)不良與違法信息舉報中心

互聯(lián)網(wǎng)新聞信息服務許可證：51120190017 網(wǎng)站備案號：蜀ICP備19004508號-3 川公網(wǎng)安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人在线免费