每日經(jīng)濟新聞 2023-02-10 20:13:05
◎ChatGPT解鎖了多樣化的文本內(nèi)容生成能力,帶來AI創(chuàng)造世界更豐富的想象空間,將會應(yīng)用于文本理解、文本創(chuàng)作、文案撰寫、知識推理、翻譯、智能客服、文本生成圖像,代碼理解、審查和生成等多個方向,具體跟一些行業(yè)應(yīng)用結(jié)合起來,將會產(chǎn)生比較大的行業(yè)影響。
每經(jīng)記者 趙李南 每經(jīng)編輯 董興生
近期,ChatGPT概念席卷A股,截至2月10日,概念股中已有股票斬獲“7連板”。
ChatGPT一經(jīng)問世,便成為輿論焦點,如今亦化身資本寵兒。但關(guān)于ChatGPT本身仍然存在不少疑問,這究竟是一個怎樣的技術(shù)?在AI發(fā)展的歷史長河中,ChatGPT的誕生,究竟算一個怎樣的事件?
近日,《每日經(jīng)濟新聞》記者專訪了美亞柏科(SZ300188,股價15.21元,市值130.73億元)人工智能科學(xué)家、AI研發(fā)中心總經(jīng)理趙建強博士。趙建強畢業(yè)于西安交通大學(xué)計算機科學(xué)與技術(shù)專業(yè),獲得博士學(xué)位。多年來,趙建強及其研發(fā)團隊在美亞柏科從事人工智能相關(guān)研究。
趙建強表示,2022年被業(yè)內(nèi)稱為AI生成的元年,ChatGPT是一個里程碑式的產(chǎn)品。同時,ChatGPT背后所依托的超大規(guī)模語言模型技術(shù)也將在各行各業(yè)產(chǎn)生深遠影響。
“除了OpenAI的GPT預(yù)訓(xùn)練模型,實際上,谷歌、微軟、Meta、百度也有推出類似的模型,但他們暫時沒有把這些功能開放成一個聊天機器人。”趙建強告訴記者。
圖片來源:公司官網(wǎng)
“在文本理解和智能問答技術(shù)方面,ChatGPT是一個里程碑式的產(chǎn)品。”趙建強說。
記者注意到,ChatGPT之所以能夠火爆出圈,重要原因是其交流的流暢度和知識的豐富程度比之前的類似產(chǎn)品有很大提高。
“在業(yè)界,我們把2022年稱為AI生成的元年,不僅是ChatGPT,實際上OpenAI還開放了圖像生成的一些模型(DALL•E 2),只是沒有像ChatGPT這么熱。ChatGPT在AI生成內(nèi)容方面或者AI創(chuàng)作方面是一個里程碑的節(jié)點,是比較有影響力的一個階段性成果。”趙建強認為。
他介紹,ChatGPT的相關(guān)技術(shù)模型此前早已有之。“OpenAI之前就發(fā)布了ChatGPT的大語言模型。ChatGPT實際上是基于GPT-3.5這個版本的超大規(guī)模自然語言預(yù)訓(xùn)練模型,之前已經(jīng)發(fā)布過GPT1.0、2.0和3.0版本,現(xiàn)在用的是GPT-3.5的版本。ChatGPT基于GPT模型,利用人類反饋強化學(xué)習(xí)訓(xùn)練的方式,學(xué)習(xí)人類提問機器答、機器提問人類答等模式,不斷訓(xùn)練迭代,以實現(xiàn)智能對話聊天功能。”
趙建強向記者解釋:“ChatGPT交流得非常順暢,基本上聊到的內(nèi)容都能回答,這主要得益于其具有的超大規(guī)模自然語言預(yù)訓(xùn)練模型GPT3.5,模型在訓(xùn)練時使用了海量人類在互聯(lián)網(wǎng)上所編輯生成的多種類文本數(shù)據(jù)集。OpenAI的官方介紹顯示,GPT訓(xùn)練使用了超萬億級單詞量的數(shù)據(jù)。此外,模型的參數(shù)規(guī)模也非常大,3.5版本的參數(shù)規(guī)模就達到了1750億。目前來看,可能只有一些AI超級巨頭才具備這樣的數(shù)據(jù)量和計算能力。”
趙建強認為,由于具備了生成能力,ChatGPT將會對很多行業(yè)產(chǎn)生影響。
“以前我們理解的AI更多處在計算智能和感知智能階段,比如圖像識別、人臉識別、文本觀點分析等?,F(xiàn)在AI已經(jīng)具備認知智能的能力,可以根據(jù)命令需求,創(chuàng)作生成各類文稿、文案,也可以通過文本場景描述生成圖像和視頻。所以說以后AI在內(nèi)容生成創(chuàng)作、文本生成文本、文本生成圖像、文本生成視頻等方面,都具有廣闊的應(yīng)用前景。ChatGPT解鎖了多樣化的文本內(nèi)容生成能力,帶來AI創(chuàng)造世界更豐富的想象空間,將會應(yīng)用于文本理解、文本創(chuàng)作、文案撰寫、知識推理、翻譯、智能客服、文本生成圖像,代碼理解、審查和生成等多個方向,具體跟一些行業(yè)應(yīng)用結(jié)合起來,將會產(chǎn)生比較大的行業(yè)影響。”趙建強表示。
此前,美亞柏科在投資者互動平臺上表示:“公司從2020年開始關(guān)注這類AI技術(shù)濫用與犯罪的行為,研究對深度合成內(nèi)容的檢測識別和鑒定相關(guān)技術(shù),研發(fā)了針對視頻圖像偽造生成檢測鑒定的產(chǎn)品,積極參與人工智能合成和生成技術(shù)合規(guī)應(yīng)用的行業(yè)標(biāo)準的制定,協(xié)助執(zhí)法部門維護網(wǎng)絡(luò)空間安全,規(guī)范人工智能技術(shù)的良性發(fā)展。”
趙建強所在的部門一直在從事AI方面的研究。“以ChatGPT為代表的超大規(guī)模語言預(yù)訓(xùn)練模型技術(shù)出現(xiàn)之后,大大推動了AI業(yè)務(wù),特別是AI生成內(nèi)容類業(yè)務(wù)落地的進程。”
美亞柏科的主要業(yè)務(wù)領(lǐng)域包括電子數(shù)據(jù)取證、大數(shù)據(jù)智能化、網(wǎng)絡(luò)空間安全、智慧城市等。
圖片來源:公司官網(wǎng)
“我們的做法也類似,我們采用‘超大規(guī)模預(yù)訓(xùn)練模型+下游任務(wù)遷移’的技術(shù)思路,利用超大規(guī)模的語言預(yù)訓(xùn)練模型,再結(jié)合具體的項目和數(shù)據(jù),訓(xùn)練形成具有行業(yè)特色的應(yīng)用模型。實際上,美亞柏科在自然語言處理、OCR、計算機視覺以及人工智能安全這些領(lǐng)域已經(jīng)開展了多年的業(yè)務(wù)實踐,基于在電子數(shù)據(jù)取證和執(zhí)法部門大數(shù)據(jù)智能化領(lǐng)域多年的深耕和知識經(jīng)驗的積累,對行業(yè)客戶數(shù)據(jù)特點和業(yè)務(wù)需求的深刻理解,提出了文本智能分析理解、不良多媒體文件分析、反詐騙信息鑒別、多模態(tài)信息檢索等多個獨有的核心算法模型,并已經(jīng)在打擊犯罪、社會治理、智慧城市建設(shè)等方面發(fā)揮了實戰(zhàn)價值。”趙建強稱。
比如在反詐騙領(lǐng)域,大語言模型的識別效果要遠超此前的識別模型。趙建強提到:“比如之前面對小模型或者小數(shù)據(jù)量的情況下,在文本的理解和識別上所實現(xiàn)的效果不是很理想,超大規(guī)模語言預(yù)訓(xùn)練模型技術(shù)將有效推動這類業(yè)務(wù)落地。”
“通過利用已有的大規(guī)模語言預(yù)訓(xùn)練模型,結(jié)合詐騙場景下的語言特點,我們就可以去學(xué)習(xí)訓(xùn)練相關(guān)的識別模型。詐騙通常是通過文本聊天交流,具有一定的語言特征,也就是詐騙話術(shù),在理解這些話術(shù)之后,再去檢測識別。”趙建強說。
趙建強繼續(xù)解釋:“比如有些受害人會被拉到一些所謂的理財群里,詐騙人員以推銷交流虛假理財投資產(chǎn)品的名義誘導(dǎo)受害人。我們就可以通過訓(xùn)練針對投資理財類聊天文本識別模型去鑒別,如果出現(xiàn)類似內(nèi)容就可以檢測出來。還有一類就是識別發(fā)現(xiàn)各種詐騙網(wǎng)站,通過對詐騙網(wǎng)站網(wǎng)址、頁面文本內(nèi)容、圖像內(nèi)容等的特征學(xué)習(xí),訓(xùn)練形成針對不同類別詐騙網(wǎng)站識別的模型,提升海量網(wǎng)站數(shù)據(jù)中打擊詐騙網(wǎng)站的能力。目前,我們已經(jīng)把這些技術(shù)和能力應(yīng)用到了反詐預(yù)警當(dāng)中。”
此外,有不少投資者也在投資者互動平臺上問及美亞柏科的相關(guān)業(yè)務(wù)。美亞柏科回復(fù)稱:“公司將ChatGPT的相關(guān)技術(shù)融合應(yīng)用到產(chǎn)品售后支持部門,基于取證產(chǎn)品知識庫,研發(fā)智能客服機器人系統(tǒng),提升服務(wù)水平。公司將在國家相關(guān)法律法規(guī)許可的框架下持續(xù)關(guān)注、研究、利用ChatGPT等新技術(shù),并與公司大數(shù)據(jù)智能化、電子數(shù)據(jù)取證等業(yè)務(wù)融合,積極參與相關(guān)行業(yè)標(biāo)準制定,并適時布局新業(yè)務(wù)。”
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP