每日經(jīng)濟(jì)新聞 2024-06-04 16:17:18
每經(jīng)編輯 杜宇 每經(jīng)實(shí)習(xí)編輯 宋欣悅
5月29日,斯坦福一AI團(tuán)隊(duì)發(fā)布了一個(gè)名為L(zhǎng)lama3-V的多模態(tài)大模型,宣稱(chēng)只需500美元就可訓(xùn)練出一個(gè)性能可與GPT4-V媲美的模型。但隨后,該團(tuán)隊(duì)發(fā)布的模型被指抄襲,其與國(guó)內(nèi)清華系大模型相似度極高。面壁智能CEO李大海和聯(lián)合創(chuàng)始人劉知遠(yuǎn)先后發(fā)文回應(yīng),表示這是一種受到國(guó)際團(tuán)隊(duì)認(rèn)可的方式,但希望大家共建開(kāi)放、合作、有信任的社區(qū)環(huán)境。目前,該團(tuán)隊(duì)已公開(kāi)道歉,并刪除了相關(guān)庫(kù)和官宣推文。
斯坦福大學(xué)AI團(tuán)隊(duì)在2024年5月29日發(fā)布了一個(gè)名為L(zhǎng)lama3-V的多模態(tài)大模型,聲稱(chēng)只需500美元就能訓(xùn)練出一個(gè)性能可與GPT4-V媲美的模型。Llama3-V不僅在社交媒體上迅速躥紅,還一度沖上了HuggingFace趨勢(shì)榜首頁(yè)。
圖片來(lái)源:X
然而,一名細(xì)心且熱心的網(wǎng)友發(fā)現(xiàn),該團(tuán)隊(duì)發(fā)布的Llama3-V和國(guó)內(nèi)大模型MiniCPM-Llama3-V 2.5有極高的相似度,后者是由國(guó)內(nèi)大模型初創(chuàng)企業(yè)“面壁智能”和清華大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室聯(lián)合推出的。
網(wǎng)友還在在面壁智能GitHub的項(xiàng)目下放出了一系列證據(jù)。
該網(wǎng)友表示,這兩個(gè)模型的結(jié)構(gòu)、代碼、配置文件都一模一樣,只有變量名被替換了。
兩個(gè)模型的代碼對(duì)比圖片來(lái)源:GitHub
隨后,面壁智能首席科學(xué)家、清華大學(xué)長(zhǎng)聘副教授劉知遠(yuǎn)在知乎上回應(yīng),MiniCPM-Llama3-V 2.5在研發(fā)時(shí)內(nèi)置了一個(gè)彩蛋,就是對(duì)“清華簡(jiǎn)”的識(shí)別能力,而Llama3-V模型居然也有一模一樣的能力。
清華簡(jiǎn)是清華大學(xué)于2008年7月收藏的一批戰(zhàn)國(guó)竹簡(jiǎn),為戰(zhàn)國(guó)中晚期文物。劉知遠(yuǎn)透露,識(shí)別清華簡(jiǎn)是MiniCPM-Llama3-V 2.5的一項(xiàng)實(shí)驗(yàn)功能,訓(xùn)練圖像是最近從出土文物中掃描并標(biāo)注,且尚未公開(kāi)發(fā)布。
關(guān)鍵性證據(jù)這不就來(lái)了!
圖片來(lái)源:知乎
而兩個(gè)模型在識(shí)別的表現(xiàn)上,正確的結(jié)果上基本一致,錯(cuò)誤的情況也頗為相似。
遭到大量質(zhì)疑后,該斯坦福團(tuán)隊(duì)成員已刪除他們?cè)赬上官宣模型的推文,并將該項(xiàng)目在Github和HuggingFace上的庫(kù)一并刪除。
圖片來(lái)源:X
最新消息,4日,斯坦福Llama3-V團(tuán)隊(duì)的兩位作者森德哈斯·沙瑪(Siddharth Sharma)和阿克沙·加格(Aksh Garg)在社交平臺(tái)上就這一學(xué)術(shù)不端行為向面壁MiniCPM團(tuán)隊(duì)正式道歉,并表示會(huì)將Llama3-V模型悉數(shù)撤下。
阿克沙表示,“首先,我們要向MiniCPM原作者道歉。我、森德哈斯·沙瑪,以及穆斯塔法(Mustafa)一起發(fā)布了Llama3-V,穆斯塔法為這個(gè)項(xiàng)目編寫(xiě)了代碼,但從昨天起就無(wú)法聯(lián)系他。我與森德哈斯·沙瑪主要負(fù)責(zé)幫助穆斯塔法進(jìn)行模型推廣。我們倆查看了最新的論文,以驗(yàn)證這項(xiàng)工作的新穎性,但并未被告知或意識(shí)到OpenBMB(清華團(tuán)隊(duì)支持發(fā)起的大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型庫(kù)與相關(guān)工具)之前的任何工作。我們向作者道歉,并對(duì)自己沒(méi)有努力驗(yàn)證這項(xiàng)工作的原創(chuàng)性感到失望。我們對(duì)所發(fā)生的事情承擔(dān)全部責(zé)任,并已撤下Llama3-V,再次致歉。”
此外,斯坦福人工智能實(shí)驗(yàn)室主任克里斯托弗·大衛(wèi)·曼寧(Christopher David Manning)也發(fā)文譴責(zé)這一抄襲行為。
圖片來(lái)源:X
據(jù)第一財(cái)經(jīng)報(bào)道,6月3日,面壁智能CEO李大海及其聯(lián)合創(chuàng)始人劉知遠(yuǎn)相繼公開(kāi)發(fā)聲,就他們公司的開(kāi)源模型被斯坦福大學(xué)AI團(tuán)隊(duì)疑似抄襲的問(wèn)題作出了回應(yīng)。
李大海在聲明中表達(dá)了對(duì)此事的深切遺憾,并指出,盡管從某種程度上看,這種模仿可以被視為他們的成果得到了國(guó)際團(tuán)隊(duì)的某種認(rèn)可,但他更強(qiáng)調(diào)應(yīng)該構(gòu)建一個(gè)開(kāi)放、協(xié)作且充滿(mǎn)信任的技術(shù)社區(qū)環(huán)境。他進(jìn)一步強(qiáng)調(diào),他們希望團(tuán)隊(duì)的努力和優(yōu)秀工作能夠吸引更多人的關(guān)注和認(rèn)可,但并非以這種被模仿甚至抄襲的方式。
圖片來(lái)源:第一財(cái)經(jīng)
面壁智能首席科學(xué)家、清華大學(xué)長(zhǎng)聘副教授劉知遠(yuǎn)也表示,人工智能的飛速發(fā)展離不開(kāi)全球算法、數(shù)據(jù)與模型的開(kāi)源共享,讓人們始終可以站在SOTA的肩上持續(xù)前進(jìn)。面壁開(kāi)源的MiniCPM-Llama3-V 2.5就用了最新的Llama3作為語(yǔ)言模型基座。而開(kāi)源共享的基石是對(duì)開(kāi)源協(xié)議的遵守,對(duì)其他貢獻(xiàn)者的信任,對(duì)前人成果的尊重和致敬,Llama3-V團(tuán)隊(duì)無(wú)疑嚴(yán)重破壞了這一點(diǎn)。他們?cè)谑艿劫|(zhì)疑后已在Huggingface刪庫(kù),該團(tuán)隊(duì)三人中的兩位也只是斯坦福大學(xué)本科生,未來(lái)還有很長(zhǎng)的路,如果知錯(cuò)能改,善莫大焉。
天眼查APP顯示,北京面壁智能科技有限責(zé)任公司成立于2022年8月,法定代表人為曾國(guó)洋,董事長(zhǎng)為李大海,注冊(cè)資本約52.46萬(wàn)人民幣,經(jīng)營(yíng)范圍包括軟件開(kāi)發(fā)、人工智能基礎(chǔ)軟件開(kāi)發(fā)、人工智能理論與算法軟件開(kāi)發(fā)、信息系統(tǒng)集成服務(wù)等。股東信息顯示,該公司由北京清語(yǔ)啟航科技中心(有限合伙)、曾國(guó)洋、李大海等共同持股。知識(shí)產(chǎn)權(quán)信息顯示,該公司已申請(qǐng)了多項(xiàng)專(zhuān)利,如“基于人工智能自適應(yīng)的NLP大模型分析系統(tǒng)”“深度學(xué)習(xí)模型統(tǒng)一應(yīng)用方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)”“基于人工智能的對(duì)話(huà)預(yù)測(cè)方法、裝置及存儲(chǔ)介質(zhì)”,當(dāng)前部分專(zhuān)利已獲授權(quán)。此外,該公司還登記了“CPM模型能力展示平臺(tái)”“面壁智能模力表格文本生成系統(tǒng)”等多個(gè)軟件著作權(quán)。
面壁智能目前已完成兩輪融資。去年4月,公司完成由知乎、智譜AI投資的數(shù)千萬(wàn)人民幣天使輪融資;今年4月,公司宣布完成新一輪數(shù)億元融資,由春華創(chuàng)投、華為哈勃領(lǐng)投,北京市人工智能產(chǎn)業(yè)投資基金等跟投,知乎作為戰(zhàn)略股東持續(xù)跟投支持。
據(jù)其官網(wǎng)顯示,面壁智能聯(lián)合創(chuàng)始人、CEO李大海,碩士畢業(yè)于北京大學(xué)數(shù)學(xué)系,畢業(yè)后加入Google,成為Google中國(guó)創(chuàng)始員工之一,后在云云網(wǎng)任工程總監(jiān),在豌豆莢任搜索技術(shù)負(fù)責(zé)人,連續(xù)12年創(chuàng)業(yè)經(jīng)驗(yàn)。2015年加入知乎,任知乎合伙人、CTO。
面壁智能聯(lián)合創(chuàng)始人、首席科學(xué)家劉知遠(yuǎn),是清華大學(xué)計(jì)算機(jī)系長(zhǎng)聘副教授,智源青年科學(xué)家。主要研究方向?yàn)樽匀徽Z(yǔ)言處理、知識(shí)圖譜和社會(huì)計(jì)算。在人工智能領(lǐng)域著名國(guó)際期刊和會(huì)議發(fā)表相關(guān)論文200余篇,Google Scholar統(tǒng)計(jì)引用超過(guò)3.1萬(wàn)次。曾獲教育部自然科學(xué)一等獎(jiǎng)、中國(guó)中文信息學(xué)會(huì)錢(qián)偉長(zhǎng)中文信息處理科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng)、入選國(guó)家青年人才計(jì)劃、《麻省理工科技評(píng)論》中國(guó)區(qū)35歲以下科技創(chuàng)新35人榜單。
圖片來(lái)源:面壁智能官網(wǎng)
每日經(jīng)濟(jì)新聞綜合第一財(cái)經(jīng)、公開(kāi)消息
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線(xiàn):4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP