要聞

OpenAI祭出AI文本檢測(cè)利器，ChatGPT即將上演“貓鼠游戲”？

每日經(jīng)濟(jì)新聞 2023-02-01 18:53:49

◎一些批評(píng)者認(rèn)為，生成式AI工具的廣泛使用可能會(huì)帶來(lái)一些潛在的有害影響。

每經(jīng)記者文巧每經(jīng)編輯高涵

ChatGPT帶來(lái)的喧囂還未歸于平靜，北京時(shí)間2月1日，其背后的公司OpenAI又趁熱打鐵推出了一款檢測(cè)工具，試圖區(qū)分人工編寫(xiě)的文本和AI生成的文本。

這款工具名為AI文本檢測(cè)器（AI Text Classifier），《每日經(jīng)濟(jì)新聞》記者親測(cè)了其檢測(cè)效果，發(fā)現(xiàn)其能成功區(qū)別單獨(dú)的人工或AI文本，但當(dāng)人工和AI文本混淆時(shí)，檢測(cè)效果并不樂(lè)觀。不過(guò)，OpenAI認(rèn)為，當(dāng)這個(gè)檢測(cè)工具與其他方法結(jié)合使用時(shí)，可能有助于防止 AI文本生成器被濫用。

“它仍然有一些局限性——因此它應(yīng)該被用作其他確定文本來(lái)源方法的補(bǔ)充，而不是作為主要的決策工具，”OpenAI在一份官方文件中表示，“我們正在提供這個(gè)初始檢測(cè)器，以獲取有關(guān)此類(lèi)工具是否有用的反饋，并希望在未來(lái)分享改進(jìn)的方法。”

隨著ChatGPT的大熱，市場(chǎng)圍繞生成式 AI的熱情不斷增長(zhǎng)。但以北密歇根大學(xué)“論文作弊”為代表的事件也引發(fā)了對(duì)于學(xué)術(shù)、倫理等方面的諸多擔(dān)憂。一些批評(píng)者認(rèn)為，生成式AI工具的廣泛使用可能會(huì)帶來(lái)一些潛在的有害影響。

直接的后果是，美國(guó)一些最大的學(xué)區(qū)已禁止在其網(wǎng)絡(luò)和設(shè)備上使用 ChatGPT。自然而然地，對(duì)類(lèi)似AI文本檢測(cè)器的工具的需求也開(kāi)始涌現(xiàn)。

親測(cè)OpenAI的AI檢測(cè)器效果：并不完美

《每日經(jīng)濟(jì)新聞》記者注意到，有趣的是，OpenAI新推出的這款檢測(cè)器在架構(gòu)上和ChatGPT一樣，它也是一種AI語(yǔ)言模型，并且也是根據(jù)來(lái)自網(wǎng)絡(luò)的許多公開(kāi)文本示例進(jìn)行訓(xùn)練的。

但與ChatGPT不同的是，它經(jīng)過(guò)微調(diào)可以預(yù)測(cè)一段文本由AI生成的可能性——不僅來(lái)自ChatGPT，還來(lái)自任何文本生成AI模型。

具體來(lái)看，OpenAI在來(lái)自5個(gè)平臺(tái)（包括OpenAI本身）的34個(gè)文本生成系統(tǒng)的文本上訓(xùn)練了這款A(yù)I文本檢測(cè)器，例如維基百科等。不過(guò)，這款A(yù)I文本檢測(cè)器至少需要1000個(gè)字符，即大約150 ~250 個(gè)單詞，才能進(jìn)行檢測(cè)。

那么，這款檢測(cè)器的效果到底如何？是否真的能完美區(qū)別AI和人工生成的文本？每經(jīng)記者對(duì)此進(jìn)行了一番測(cè)試。

我們先讓ChatGPT寫(xiě)了一篇主題為AI未來(lái)的文章，并用檢測(cè)器對(duì)其進(jìn)行檢測(cè)，結(jié)果顯示，“檢測(cè)器認(rèn)為文本很可能是AI生成的”。

圖片來(lái)源：AI Text Classifier

隨后，我們用了一篇人工寫(xiě)作的文本再次進(jìn)行檢測(cè)，結(jié)果顯示，“檢測(cè)器認(rèn)為文本非常不可能是AI生成的”。

圖片來(lái)源：AI Text Classifier

從上述結(jié)果來(lái)看，OpenAI的這款A(yù)I文本檢測(cè)器的確成功區(qū)分了人工和AI生成的文本。然而，我們將兩個(gè)文本結(jié)合后（AI文本占比超90%）再進(jìn)行檢測(cè)，它并不能檢測(cè)出AI生成的文本。

圖片來(lái)源：AI Text Classifier

從每經(jīng)記者親身體驗(yàn)來(lái)看，目前，要靠這個(gè)AI文本檢測(cè)器來(lái)抓作弊還有些困難。

據(jù)OpenAI的一份文件，該檢測(cè)器將文本標(biāo)記為“非常不可能”由AI生成的可能性小于10%；“不太可能”由AI生成的可能性為10%~45%；“不清楚它是否是”AI生成的可能性為45%~90%；“可能”是AI生成的幾率為90%~98%。

在準(zhǔn)確性上，OpenAI也承認(rèn)，“鑒于AI生成的內(nèi)容在互聯(lián)網(wǎng)上的激增，它可能無(wú)意中將一些AI編寫(xiě)的文本錯(cuò)誤分類(lèi)為人類(lèi)編寫(xiě)的文本。”

“AI槍手”引擔(dān)憂，“貓鼠游戲”就此開(kāi)始？

1月中旬，北密歇根大學(xué)的論文作弊事件讓學(xué)術(shù)界著實(shí)震驚了一把。在這次事件之后，在美國(guó)，許多大學(xué)教授、系主任和管理人員都在對(duì)課堂進(jìn)行大規(guī)模的調(diào)整，以應(yīng)對(duì)ChatGPT對(duì)教學(xué)活動(dòng)造成的巨大沖擊。很多教授在重新設(shè)計(jì)課程，更多地采用口試、小組合作和手寫(xiě)文章作為評(píng)估方式。

紐約和西雅圖等最大的學(xué)區(qū)最近已禁止在其設(shè)備和網(wǎng)絡(luò)中使用 ChatGPT，許多大學(xué)也在考慮采取類(lèi)似措施。

在更早之前，全球最大的編程技術(shù)問(wèn)答網(wǎng)站Stack Overflow緊急宣布，ChatGPT在該站暫時(shí)封禁。Stack Overflow在官方通告中表示，做出這個(gè)規(guī)定的主要原因是，ChatGPT自動(dòng)生成的答案質(zhì)量太低，錯(cuò)誤太多，而且看上去還挺像那么回事，即使是完全不懂的人也能隨便生成答案。

在“AI槍手”帶來(lái)的擔(dān)憂之下，一些其他的AI文本檢測(cè)器也如雨后春筍般涌現(xiàn)，以滿足當(dāng)前的需求。

在OpenAI推出自己的檢測(cè)器之前，普林斯頓大學(xué)的一名學(xué)生Edward Tian開(kāi)發(fā)了ChatZero，來(lái)檢測(cè)文本是否可能是AI生成。據(jù)報(bào)道，1月3日，該網(wǎng)站一經(jīng)上線，一周內(nèi)就有超過(guò)3萬(wàn)人試用。

一名用戶展示GPTZero的檢測(cè)效果圖片來(lái)源：推特

不過(guò)，一些用戶也報(bào)告了GPTZero檢測(cè)的錯(cuò)誤結(jié)果。Edward Tian也承認(rèn)，檢測(cè)并非百分之百準(zhǔn)確，他仍在努力提高模型的準(zhǔn)確性。

據(jù)此前報(bào)道，包括斯坦福大學(xué)在內(nèi)的一些機(jī)構(gòu)聯(lián)合提出一種名為DetectGPT的新方法，來(lái)區(qū)分AI生成的文章。

開(kāi)源AI社區(qū)Hugging Face也推出了一種工具來(lái)檢測(cè)文本是否由 GPT-2 創(chuàng)建，GPT-2 是用于開(kāi)發(fā) ChatGPT 的 AI 模型的早期版本。據(jù)悉，南卡羅來(lái)納州的一位哲學(xué)教授用這個(gè)工具抓獲了一名提交了 AI 編寫(xiě)的作業(yè)的學(xué)生。

除此之外，谷歌搜索以及檢測(cè)學(xué)術(shù)抄襲的Turnitin也正在開(kāi)發(fā)自己的AI生成文本檢測(cè)器，谷歌搜索據(jù)悉至少會(huì)推出6個(gè)應(yīng)用程序來(lái)對(duì)AI和人工文本進(jìn)行區(qū)分。

科技媒體Techcrunch對(duì)此評(píng)論稱(chēng)，這很可能會(huì)成為一場(chǎng)貓捉老鼠的游戲。隨著文本生成AI的改進(jìn)，檢測(cè)器也會(huì)改進(jìn)——這是一種永無(wú)止境的來(lái)回交流，類(lèi)似于網(wǎng)絡(luò)犯罪分子和安全研究人員之間的交流。

正如OpenAI 所寫(xiě)，雖然檢測(cè)器在某些情況下可能有所幫助，但它們永遠(yuǎn)不會(huì)成為確定文本是否由AI生成的可靠唯一證據(jù)。“也就是說(shuō)，目前還沒(méi)有靈丹妙藥可以解決AI生成的文本所帶來(lái)的問(wèn)題，”Techcrunch這樣寫(xiě)道。

封面圖片來(lái)源：攝圖網(wǎng)-307064405

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

ChatGPT 人工智能

上一篇文章

鼎捷軟件：累計(jì)回購(gòu)420萬(wàn)股，占比1.57%

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

新時(shí)達(dá)：公司工業(yè)機(jī)器人產(chǎn)品的控制器和伺服驅(qū)動(dòng)器等控驅(qū)系統(tǒng)為自主研發(fā)

相關(guān)文章