每日經(jīng)濟(jì)新聞 2023-03-27 22:06:23
每經(jīng)記者 文巧 每經(jīng)編輯 蘭素英
自ChatGPT風(fēng)靡全球后,AI版權(quán)問題一直是一個(gè)擔(dān)憂。AI模型的訓(xùn)練需要大量數(shù)據(jù)和內(nèi)容,但其中許多有版權(quán)歸屬,AI公司是否該為使用這些內(nèi)容付費(fèi),成為近來國外爭論不休的一個(gè)焦點(diǎn)。
據(jù)《華爾街日報(bào)》3月22日報(bào)道,擁有《紐約郵報(bào)》、《巴倫周刊》《華爾街日報(bào)》等的美國新聞集團(tuán)正準(zhǔn)備通過法律程序向技術(shù)制造商如OpenAI、微軟和谷歌要求賠償。
有關(guān)這類討論的一個(gè)核心問題是,AI公司是否有權(quán)從互聯(lián)網(wǎng)上抓取內(nèi)容,并將其輸入到訓(xùn)練模型中。一些批評者認(rèn)為,AI 技術(shù)使工業(yè)規(guī)模的知識(shí)產(chǎn)權(quán)盜竊成為可能。
《每日經(jīng)濟(jì)新聞》記者注意到,同類訴訟已經(jīng)涉及到在AI模型中使用圖像和代碼數(shù)據(jù)進(jìn)行訓(xùn)練的問題。例如,Midjourney 、Stability AI、微軟、GitHub以及OpenAI都曾卷入相關(guān)訴訟案中。若美國新聞集團(tuán)對微軟、谷歌、OpenAI提起訴訟,將是第一起針對文本類的相關(guān)案件。
不過,AI工具仍處于進(jìn)入商業(yè)應(yīng)用的早期,對版權(quán)問題還沒有形成固定的準(zhǔn)則。AI公司是否有權(quán)從互聯(lián)網(wǎng)上抓取內(nèi)容并訓(xùn)練模型,也是一項(xiàng)模糊不明的法律問題。法律人士認(rèn)為,所有針對生成式AI的案件可能需要數(shù)年時(shí)間才能結(jié)案。隨著科技公司自身也更加注意到版權(quán)問題,與內(nèi)容出版商達(dá)成協(xié)議尋求使用許可,或許是最好的解決辦法。
不付錢隨便用?文字版權(quán)商怒了
《華爾街日報(bào)》援引一位熟悉媒體聯(lián)盟組織(The News Media Alliance)的人士稱,最近幾周,一些新聞業(yè)高管已經(jīng)在研究他們的內(nèi)容在多大程度上被用于訓(xùn)練ChatGPT、Bard等AI工具,并正在探索如何通過法律途徑獲得補(bǔ)償。“我們擁有有價(jià)值的內(nèi)容,這些是人工辛勤勞作的結(jié)晶,但這些內(nèi)容不斷被用于為其他人創(chuàng)造收入,因此必須得到補(bǔ)償,”該組織在接受采訪時(shí)這樣說道。
3月21日,谷歌公司推出了聊天機(jī)器人Bard測試版本,以期追趕ChatGPT。不過,在推特網(wǎng)友進(jìn)行的早期測試中,Bard提供的答案通常不會(huì)給出基礎(chǔ)新聞來源的鏈接。例如,當(dāng)被要求提供《紐約時(shí)報(bào)》最大新聞的摘要時(shí),Bard回應(yīng)了一份清單,在答案結(jié)尾它給出“有關(guān)這些和其他故事的更多信息,請?jiān)L問紐約時(shí)報(bào)網(wǎng)站”的提示,但沒有提供答案的鏈接或引用。
這類事件引起了許多內(nèi)容發(fā)布商的關(guān)注。美國社交網(wǎng)站Reddit已與微軟就后者在AI模型訓(xùn)練中使用內(nèi)容的情況進(jìn)行了會(huì)談。
美國新聞集團(tuán)NWSA首席執(zhí)行官Robert Thomson在最近的一次投資者會(huì)議上表示,“已經(jīng)開始與某一方進(jìn)行討論。很明顯,他們使用的是專有內(nèi)容——顯然,應(yīng)該為此提供一些補(bǔ)償。”
《華爾街日報(bào)》評論稱,AI工具的出現(xiàn)加劇了大型科技公司與出版界之間本已緊張的關(guān)系。一直以來,出版商依賴谷歌、Meta等科技公司的幫助,以使其內(nèi)容覆蓋更廣泛的受眾。但與此同時(shí),也有越來越多的出版商要求科技公司為使用其內(nèi)容而付費(fèi)。
出版商擔(dān)心的是,AI工具可能會(huì)耗盡他們網(wǎng)站的流量和廣告費(fèi)用。盡管微軟首席執(zhí)行官Satya Nadella表示,“一切都是可點(diǎn)擊訪問的”,不過一些出版業(yè)高管表示,有多少用戶會(huì)真正點(diǎn)擊這些鏈接并訪問他們的網(wǎng)站,這是一個(gè)懸而未決的問題。
據(jù)報(bào)道,在美國、日本、歐盟等地的法律中,均有“合理使用”條款,允許個(gè)人、公司在某些情況下未經(jīng)許可使用受版權(quán)保護(hù)的材料。許多AI公司也援引這一條款為自己申辯,但出版商則認(rèn)為,大量使用受版權(quán)保護(hù)的內(nèi)容訓(xùn)練AI,是對這一特許權(quán)利的濫用。
圖像、代碼類訴訟近年來屢見不鮮
在AI工具如何合理使用已有內(nèi)容的爭論中,一個(gè)核心的問題是,AI公司是否有合法權(quán)利從互聯(lián)網(wǎng)上抓取內(nèi)容,并將其輸入到訓(xùn)練模型中。一些批評者認(rèn)為,AI技術(shù)使工業(yè)規(guī)模的知識(shí)產(chǎn)權(quán)盜竊成為可能。
實(shí)際上,AI訓(xùn)練產(chǎn)生的版權(quán)擔(dān)憂并非始于ChatGPT。2022年,OpenAI推出的Dall-E 2、Stability AI 創(chuàng)建的Stable Diffusion以及由Midjourney發(fā)布的同名AI圖像工具掀起了圖像AI的風(fēng)潮。
在這些AI工具中,許多作品通過模仿一些攝影圖片或知名畫作的風(fēng)格而生成。為了讓算法能夠模仿這些風(fēng)格,構(gòu)建它們的公司首先必須從互聯(lián)網(wǎng)上復(fù)制這些作品,然后用其來訓(xùn)練AI模型。因此,這些公司也由于版權(quán)問題而卷入一樁又一樁的訴訟案中。
今年2月,Getty Images在特拉華州起訴了Stability AI,指控其侵犯圖片版權(quán);1月,以畫家Grzegorz Rutkowski為首的一批藝術(shù)家作為原告對Midjourney、Stability AI提起了集體訴訟。
更早之前,去年11月,美國加州的聯(lián)邦法院也提起了一項(xiàng)集體訴訟,針對微軟及其子公司GitHub和OpenAI的GitHub Copilot系統(tǒng)。原告稱,該系統(tǒng)生成了不注明原作者姓名的代碼,違反了各種開源許可以及《數(shù)字千年版權(quán)法》。
負(fù)責(zé)前述針對微軟和GitHub案件的律師Joseph Saveri認(rèn)為,美國司法部在1990年代成功起訴微軟的反競爭行為(例如將Internet Explorer網(wǎng)絡(luò)瀏覽器與Windows操作系統(tǒng)捆綁在一起),與今天有一些相似之處。現(xiàn)在和那時(shí)一樣,他看到微軟正在迅速采取行動(dòng),以主導(dǎo)它認(rèn)為對下一代互聯(lián)網(wǎng)和計(jì)算很重要的領(lǐng)域。
到目前為止,同類訴訟已經(jīng)涉及到在AI模型中使用圖像和代碼數(shù)據(jù)進(jìn)行訓(xùn)練的問題,但還沒有出現(xiàn)涉及文本類內(nèi)容的重大案件。也就是說,如果此次美國新聞集團(tuán)對微軟、谷歌、OpenAI提起訴訟,將是第一起針對文本內(nèi)容的案件。
相關(guān)立法預(yù)計(jì)將引入實(shí)際上,科技公司自身也已經(jīng)注意到了AI訓(xùn)練中所涉及的版權(quán)問題。與內(nèi)容出版商達(dá)成協(xié)議尋求使用許可,或許是最好的解決辦法。
OpenAI首席執(zhí)行官Sam Altman曾表示,“我們在合理使用方面做了很多工作”。他透露,OpenAI將在必要時(shí)就內(nèi)容達(dá)成交易。“我們愿意為某些領(lǐng)域非常高質(zhì)量的數(shù)據(jù)付出高昂的代價(jià),”他這樣說道。
在OpenAI已經(jīng)達(dá)成的商業(yè)協(xié)議中,Sam Altman提到了去年秋天與在線圖庫Shutterstock達(dá)成的一項(xiàng)協(xié)議。OpenAI從 Shutterstock獲得數(shù)據(jù)許可,并且Shutterstock開始使用 OpenAI 技術(shù)。與此同時(shí),Shutterstock 設(shè)立了一個(gè)基金,為那些作品被用于AI訓(xùn)練的藝術(shù)家提供補(bǔ)償。
據(jù)報(bào)道,谷歌方面已經(jīng)達(dá)成協(xié)議,向包括新聞集團(tuán)在內(nèi)的一些出版商支付費(fèi)用,以在Google News Showcase的產(chǎn)品中使用他們的內(nèi)容,不過該產(chǎn)品尚未在美國推出;多年來,微軟一直為其MSN平臺(tái)的內(nèi)容向出版商付款,但這些交易目前還不包括AI產(chǎn)品。
華盛頓大學(xué)的法律學(xué)者Inyoung Cheong表示,法院在判決時(shí),要權(quán)衡這類新技術(shù)在使用這些內(nèi)容時(shí)的潛在危害和好處,所有針對生成式AI的案件可能需要數(shù)年時(shí)間才能結(jié)案。
在法律層面,據(jù)知情人士透露,允許美國出版商在不違反反壟斷法規(guī)的情況下進(jìn)行集體談判的立法預(yù)計(jì)將很快引入,該立法將涵蓋AI工具對受版權(quán)保護(hù)內(nèi)容的合法使用。
此前,美國版權(quán)局表示,已經(jīng)發(fā)起一項(xiàng)研究AI工具的倡議,包括在AI模型訓(xùn)練中對受版權(quán)保護(hù)內(nèi)容的使用。
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP