每日經(jīng)濟新聞

要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

斯嘉麗怒斥OpenAI：山寨我的聲音！連朋友都分辨不出來

每日經(jīng)濟新聞 2024-05-21 14:22:24

每經(jīng)編輯杜宇每經(jīng)實習編輯宋欣悅

5月21日，著名影星斯嘉麗·約翰遜（Scarlett Johansson）指控OpenAI的ChatGPT，非法使用其聲音并要求下架，表示對OpenAI的行為感到“震驚”和“憤怒”。對此，OpenAI回應稱，將暫停使用“Sky”模式的聲音，并詳細介紹了語音選擇的創(chuàng)作流程，強調所有配音均來自專業(yè)演員。

此前，OpenAI推出新旗艦模型GPT-4o，該模型在保留了之前的五種語音模式的基礎上，大大提升了圖像和音頻理解方面的能力，能夠進行實時語音通信，可以識別音調、說話的人和背景噪音，甚至可以輸出笑聲、歌唱聲和表達情感。

圖片來源：X

斯嘉麗怒懟ChatGPT語音模式：山寨！

5月21日，斯嘉麗·約翰遜在社交平臺發(fā)長文指控OpenAI非法使用她的聲音，要求下架“Sky”模式。她表示，這種行為不僅侵犯了她的權利，還引發(fā)了公眾對AI技術濫用的擔憂。

斯嘉麗在其長文中透露，早在2023年9月，OpenAI曾聯(lián)系她，希望她為ChatGPT的語音模式配音，但因個人原因她拒絕了這個邀請。就在產(chǎn)品發(fā)布會前兩天，OpenAI再次嘗試說服她配音，依舊遭到拒絕。然而，斯嘉麗在最終發(fā)布的產(chǎn)品中發(fā)現(xiàn)“Sky”模式的聲音與她本人非常相似。她表示，自己聽到演示后，感到震驚、憤怒和難以置信，無法相信OpenAI竟會使用一個如此像她的聲音，連她的親密朋友和新聞媒體都分辨不出Sky和她本人聲音的差別。

圖片來源：X

此外，斯嘉麗提到，OpenAI首席執(zhí)行官薩姆·阿爾特曼（Sam Altman）在GPT-4o發(fā)布時，在社交平臺上只發(fā)了一個詞“Her”，不禁讓人聯(lián)想到，斯嘉麗在2013年科幻AI電影《Her》中為女主AI配音的經(jīng)歷，是否在暗示這種相似是故意為之？

圖片來源：X

斯嘉麗強調，“在這個我們都在努力應對深度偽造，保護自身形象、作品和身份的時代，我認為這些問題需要得到絕對的明確。我期待通過透明度和立法來解決這些問題，以確保個人權利得到保護。”

面對指控，OpenAI迅速做出反應，宣布暫停使用“Sky”模式的聲音。他們在官網(wǎng)上詳細介紹了ChatGPT語音模式的創(chuàng)作流程，強調所有聲音都是從400多名專業(yè)配音演員中挑選出來的，并經(jīng)過嚴格的審核。

OpenAI的官方聲明中提到：“我們收到了關于ChatGPT選取聲音方式的一些質疑，尤其是針對“Sky”。目前，我們正積極采取措施，暫停“Sky”的使用，以解決這些問題。”

GPT-4o：對話式AI的巨大飛躍

此前，ChatGPT的語音模式包括Breeze、Cove、Ember、Juniper和Sky五種聲音。這些聲音是經(jīng)過精心挑選，以滿足用戶的多樣化需求。每種聲音都擁有獨特的情感和聲音特質，為用戶提供了更加豐富的交互體驗。

而最新發(fā)布的GPT-4o版本不僅保留了之前的五種語音模式，還進一步提升了語音交互的自然度和情感表達能力。GPT-4o在語音識別和生成方面進行了多項改進，使得AI助手更加智能和人性化。

據(jù)介紹，新模型使ChatGPT能夠處理50種不同的語言，同時提高了速度和質量。

GPT-4o是邁向更自然人機交互的一步，它可以接受文本、音頻和圖像三者組合作為輸入，并生成文本、音頻和圖像的任意組合輸出，“與現(xiàn)有模型相比，GPT-4o在圖像和音頻理解方面尤其出色。”

在GPT-4o之前，用戶使用語音模式與ChatGPT對話時，GPT-3.5的平均延遲為2.8秒，GPT-4為5.4秒，音頻在輸入時還會由于處理方式丟失大量信息，讓GPT-4無法直接觀察音調、說話的人和背景噪音，也無法輸出笑聲、歌唱聲和表達情感。

與之相比，GPT-4o可以在232毫秒內對音頻輸入做出反應，與人類在對話中的反應時間相近。在錄播視頻中，兩位高管做出了演示：機器人能夠從急促的喘氣聲中理解“緊張”的含義，并且指導他進行深呼吸，還可以根據(jù)用戶要求變換語調。

圖片來源：截圖于Youtube

圖像輸入方面，演示視頻顯示，OpenAI高管啟動攝像頭要求實時完成一個一元方程題，ChatGPT輕松完成了任務；另外，高管還展示了ChatGPT桌面版對代碼和電腦桌面（一張氣溫圖表）進行實時解讀的能力。

圖片來源：截圖于Youtube

OpenAI稱，“我們跨文本、視覺和音頻端到端地訓練了一個新模型，這意味著所有輸入和輸出都由同一神經(jīng)網(wǎng)絡處理。由于GPT-4o是我們第一個結合所有這些模式的模型，因此我們仍然只是淺嘗輒止地探索該模型的功能及其局限性。”

如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

GPT Ai OpenAI

上一篇文章

創(chuàng)業(yè)板指跌逾1% 下跌個股近4400只

返回每經(jīng)網(wǎng)首頁

下一篇文章

以軍稱在加沙北部杰巴利耶難民營地道內發(fā)現(xiàn)被扣押人員遺體

相關文章

熱文精選

點擊排行

歡迎關注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

相關信息
關于我們
版權聲明

關注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2025 每日經(jīng)濟新聞報社版權所有，未經(jīng)許可不得轉載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡社會征信網(wǎng)

兒童色情信息舉報專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報中心

四川省互聯(lián)網(wǎng)舉報中心

中國互聯(lián)網(wǎng)舉報中心

每日經(jīng)濟新聞互聯(lián)網(wǎng)不良與違法信息舉報中心

互聯(lián)網(wǎng)新聞信息服務許可證：51120190017 網(wǎng)站備案號：蜀ICP備19004508號-3 川公網(wǎng)安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人在线免费