每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

OpenAI祭出AI文本檢測(cè)利器,ChatGPT即將上演“貓鼠游戲”?

每日經(jīng)濟(jì)新聞 2023-02-01 18:53:49

◎一些批評(píng)者認(rèn)為,生成式AI工具的廣泛使用可能會(huì)帶來(lái)一些潛在的有害影響。

每經(jīng)記者 文巧    每經(jīng)編輯 高涵    

ChatGPT帶來(lái)的喧囂還未歸于平靜,北京時(shí)間2月1日,其背后的公司OpenAI又趁熱打鐵推出了一款檢測(cè)工具,試圖區(qū)分人工編寫(xiě)的文本和AI生成的文本。

這款工具名為AI文本檢測(cè)器(AI Text Classifier),《每日經(jīng)濟(jì)新聞》記者親測(cè)了其檢測(cè)效果,發(fā)現(xiàn)其能成功區(qū)別單獨(dú)的人工或AI文本,但當(dāng)人工和AI文本混淆時(shí),檢測(cè)效果并不樂(lè)觀。不過(guò),OpenAI認(rèn)為,當(dāng)這個(gè)檢測(cè)工具與其他方法結(jié)合使用時(shí),可能有助于防止 AI文本生成器被濫用。

“它仍然有一些局限性——因此它應(yīng)該被用作其他確定文本來(lái)源方法的補(bǔ)充,而不是作為主要的決策工具,”OpenAI在一份官方文件中表示,“我們正在提供這個(gè)初始檢測(cè)器,以獲取有關(guān)此類工具是否有用的反饋,并希望在未來(lái)分享改進(jìn)的方法。”

隨著ChatGPT的大熱,市場(chǎng)圍繞生成式 AI的熱情不斷增長(zhǎng)。但以北密歇根大學(xué)“論文作弊”為代表的事件也引發(fā)了對(duì)于學(xué)術(shù)、倫理等方面的諸多擔(dān)憂。一些批評(píng)者認(rèn)為,生成式AI工具的廣泛使用可能會(huì)帶來(lái)一些潛在的有害影響。

直接的后果是,美國(guó)一些最大的學(xué)區(qū)已禁止在其網(wǎng)絡(luò)和設(shè)備上使用 ChatGPT。自然而然地,對(duì)類似AI文本檢測(cè)器的工具的需求也開(kāi)始涌現(xiàn)。

親測(cè)OpenAI的AI檢測(cè)器效果:并不完美

《每日經(jīng)濟(jì)新聞》記者注意到,有趣的是,OpenAI新推出的這款檢測(cè)器在架構(gòu)上和ChatGPT一樣,它也是一種AI語(yǔ)言模型,并且也是根據(jù)來(lái)自網(wǎng)絡(luò)的許多公開(kāi)文本示例進(jìn)行訓(xùn)練的。

但與ChatGPT不同的是,它經(jīng)過(guò)微調(diào)可以預(yù)測(cè)一段文本由AI生成的可能性——不僅來(lái)自ChatGPT,還來(lái)自任何文本生成AI模型。

具體來(lái)看,OpenAI在來(lái)自5個(gè)平臺(tái)(包括OpenAI本身)的34個(gè)文本生成系統(tǒng)的文本上訓(xùn)練了這款A(yù)I文本檢測(cè)器,例如維基百科等。不過(guò),這款A(yù)I文本檢測(cè)器至少需要1000個(gè)字符,即大約150 ~250 個(gè)單詞,才能進(jìn)行檢測(cè)。

那么,這款檢測(cè)器的效果到底如何?是否真的能完美區(qū)別AI和人工生成的文本?每經(jīng)記者對(duì)此進(jìn)行了一番測(cè)試。

我們先讓ChatGPT寫(xiě)了一篇主題為AI未來(lái)的文章,并用檢測(cè)器對(duì)其進(jìn)行檢測(cè),結(jié)果顯示,“檢測(cè)器認(rèn)為文本很可能是AI生成的”。

圖片來(lái)源:AI Text Classifier

隨后,我們用了一篇人工寫(xiě)作的文本再次進(jìn)行檢測(cè),結(jié)果顯示,“檢測(cè)器認(rèn)為文本非常不可能是AI生成的”。

圖片來(lái)源:AI Text Classifier

從上述結(jié)果來(lái)看,OpenAI的這款A(yù)I文本檢測(cè)器的確成功區(qū)分了人工和AI生成的文本。然而,我們將兩個(gè)文本結(jié)合后(AI文本占比超90%)再進(jìn)行檢測(cè),它并不能檢測(cè)出AI生成的文本。

圖片來(lái)源:AI Text Classifier


從每經(jīng)記者親身體驗(yàn)來(lái)看,目前,要靠這個(gè)AI文本檢測(cè)器來(lái)抓作弊還有些困難。

據(jù)OpenAI的一份文件,該檢測(cè)器將文本標(biāo)記為“非常不可能”由AI生成的可能性小于10%;“不太可能”由AI生成的可能性為10%~45%;“不清楚它是否是”AI生成的可能性為45%~90%;“可能”是AI生成的幾率為90%~98%。

在準(zhǔn)確性上,OpenAI也承認(rèn),“鑒于AI生成的內(nèi)容在互聯(lián)網(wǎng)上的激增,它可能無(wú)意中將一些AI編寫(xiě)的文本錯(cuò)誤分類為人類編寫(xiě)的文本。”

“AI槍手”引擔(dān)憂,“貓鼠游戲”就此開(kāi)始?

1月中旬,北密歇根大學(xué)的論文作弊事件讓學(xué)術(shù)界著實(shí)震驚了一把。在這次事件之后,在美國(guó),許多大學(xué)教授、系主任和管理人員都在對(duì)課堂進(jìn)行大規(guī)模的調(diào)整,以應(yīng)對(duì)ChatGPT對(duì)教學(xué)活動(dòng)造成的巨大沖擊。很多教授在重新設(shè)計(jì)課程,更多地采用口試、小組合作和手寫(xiě)文章作為評(píng)估方式。

紐約和西雅圖等最大的學(xué)區(qū)最近已禁止在其設(shè)備和網(wǎng)絡(luò)中使用 ChatGPT,許多大學(xué)也在考慮采取類似措施。

在更早之前,全球最大的編程技術(shù)問(wèn)答網(wǎng)站Stack Overflow緊急宣布,ChatGPT在該站暫時(shí)封禁。Stack Overflow在官方通告中表示,做出這個(gè)規(guī)定的主要原因是,ChatGPT自動(dòng)生成的答案質(zhì)量太低,錯(cuò)誤太多,而且看上去還挺像那么回事,即使是完全不懂的人也能隨便生成答案。

在“AI槍手”帶來(lái)的擔(dān)憂之下,一些其他的AI文本檢測(cè)器也如雨后春筍般涌現(xiàn),以滿足當(dāng)前的需求。

在OpenAI推出自己的檢測(cè)器之前,普林斯頓大學(xué)的一名學(xué)生Edward Tian開(kāi)發(fā)了ChatZero,來(lái)檢測(cè)文本是否可能是AI生成。據(jù)報(bào)道,1月3日,該網(wǎng)站一經(jīng)上線,一周內(nèi)就有超過(guò)3萬(wàn)人試用。

一名用戶展示GPTZero的檢測(cè)效果 圖片來(lái)源:推特

不過(guò),一些用戶也報(bào)告了GPTZero檢測(cè)的錯(cuò)誤結(jié)果。Edward Tian也承認(rèn),檢測(cè)并非百分之百準(zhǔn)確,他仍在努力提高模型的準(zhǔn)確性。

據(jù)此前報(bào)道,包括斯坦福大學(xué)在內(nèi)的一些機(jī)構(gòu)聯(lián)合提出一種名為DetectGPT的新方法,來(lái)區(qū)分AI生成的文章。

開(kāi)源AI社區(qū)Hugging Face也推出了一種工具來(lái)檢測(cè)文本是否由 GPT-2 創(chuàng)建,GPT-2 是用于開(kāi)發(fā) ChatGPT 的 AI 模型的早期版本。據(jù)悉,南卡羅來(lái)納州的一位哲學(xué)教授用這個(gè)工具抓獲了一名提交了 AI 編寫(xiě)的作業(yè)的學(xué)生。

除此之外,谷歌搜索以及檢測(cè)學(xué)術(shù)抄襲的Turnitin也正在開(kāi)發(fā)自己的AI生成文本檢測(cè)器,谷歌搜索據(jù)悉至少會(huì)推出6個(gè)應(yīng)用程序來(lái)對(duì)AI和人工文本進(jìn)行區(qū)分。

科技媒體Techcrunch對(duì)此評(píng)論稱,這很可能會(huì)成為一場(chǎng)貓捉老鼠的游戲。隨著文本生成AI的改進(jìn),檢測(cè)器也會(huì)改進(jìn)——這是一種永無(wú)止境的來(lái)回交流,類似于網(wǎng)絡(luò)犯罪分子和安全研究人員之間的交流。

正如OpenAI 所寫(xiě),雖然檢測(cè)器在某些情況下可能有所幫助,但它們永遠(yuǎn)不會(huì)成為確定文本是否由AI生成的可靠唯一證據(jù)。“也就是說(shuō),目前還沒(méi)有靈丹妙藥可以解決AI生成的文本所帶來(lái)的問(wèn)題,”Techcrunch這樣寫(xiě)道。

封面圖片來(lái)源:攝圖網(wǎng)-307064405

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

ChatGPT 人工智能

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人 在线 免费