每日經(jīng)濟(jì)新聞 2023-10-24 22:13:24
◎通用大模型有點(diǎn)像一個(gè)985的名校本科生,很聰明,綜合能力也很強(qiáng),各種知識(shí)都懂一些。你問(wèn)他各種知識(shí),也能回復(fù)得很好。但大學(xué)畢業(yè)生在專(zhuān)業(yè)崗位方面還缺乏培訓(xùn),還需要上崗前專(zhuān)業(yè)知識(shí)的培訓(xùn)。
◎“真正在專(zhuān)業(yè)領(lǐng)域,它的產(chǎn)品形態(tài)跟消費(fèi)者使用的一問(wèn)一答式是不一樣的。我們這個(gè)系統(tǒng)要更專(zhuān)業(yè)、更垂直化,然后才能解決大模型幻覺(jué)問(wèn)題?!?/p>
每經(jīng)記者 朱成祥 每經(jīng)編輯 梁梟
近日,達(dá)觀數(shù)據(jù)董事長(zhǎng)陳運(yùn)文在上海張江公司總部接受了《每日經(jīng)濟(jì)新聞》記者專(zhuān)訪。
達(dá)觀數(shù)據(jù)專(zhuān)注于文本智能機(jī)器人,利用自然語(yǔ)言處理、智能文檔處理、光學(xué)字符識(shí)別、知識(shí)圖譜等技術(shù)為大型企業(yè)和政府機(jī)構(gòu)提供機(jī)器人流程自動(dòng)化(RPA)、文檔智能審閱等產(chǎn)品。
關(guān)于達(dá)觀數(shù)據(jù)“曹植”大模型研發(fā)的經(jīng)過(guò),陳運(yùn)文介紹,春節(jié)以前,達(dá)觀數(shù)據(jù)就已經(jīng)著手大模型的開(kāi)發(fā),還在全公司為大模型征名,剛過(guò)完春節(jié),就把名字定下來(lái)。彼時(shí),大模型的熱度還沒(méi)有起來(lái)。
在選擇模型名稱時(shí),達(dá)觀數(shù)據(jù)考慮了各種山川宇宙、神仙等名字,但最終選擇了“曹植”。原因在于,“曹植”內(nèi)含文化典故,在中國(guó)文化中具有一定的知名度。
目前,大模型普遍存在“一本正經(jīng)地胡說(shuō)八道”現(xiàn)象,這也被稱為“大模型幻覺(jué)”。對(duì)于如何解決這一問(wèn)題,陳運(yùn)文表示:“我們?cè)诖怪鳖I(lǐng)域強(qiáng)調(diào)人機(jī)結(jié)合。這些工作100%讓人工智能做是不現(xiàn)實(shí)的,需要人去控制,即人工智能可以當(dāng)你的助理。”
陳運(yùn)文舉例:“比如寫(xiě)一個(gè)報(bào)告,不是讓人工智能從頭到尾全寫(xiě),而是給到人工智能報(bào)告中主要觀點(diǎn)。觀點(diǎn)是人定的,人定大綱、人定骨架,人工智能去填里面細(xì)節(jié)文字。這種(人機(jī))結(jié)合的方式,在我們(智能文本)這種專(zhuān)業(yè)領(lǐng)域是非常好的辦法。”
此前,記者在采訪時(shí)了解到,目前大模型在應(yīng)用層面仍需進(jìn)步。比如目前ChatGPT仍舊是對(duì)話框形式,這種對(duì)話模式是否限制了大模型能力的發(fā)揮?
陳運(yùn)文端著筆記本,一邊向記者展示一邊說(shuō)道:“你看我們寫(xiě)報(bào)告的界面,這個(gè)是曹植大模型寫(xiě)的,人工智能根據(jù)標(biāo)題,生成文章大綱。但人工智能生成的大綱,未必能夠滿足要求。因此,生成大綱之后,人可以在生成的基礎(chǔ)上修改,修改完以后,它(人工智能)會(huì)根據(jù)寫(xiě)好的大綱生成正文,并且在正文里還可以配圖、配表。這是一個(gè)人機(jī)交互的過(guò)程,并非如ChatGPT那樣一問(wèn)一答式。”
陳運(yùn)文具體描述稱:“我們不僅分步驟,也是分段寫(xiě)。比如100頁(yè)的投標(biāo)書(shū)或者項(xiàng)目結(jié)項(xiàng)報(bào)告,AI并不是從頭到尾100頁(yè)一下子全寫(xiě)好。這種專(zhuān)業(yè)報(bào)告是非常復(fù)雜的,報(bào)告里面有圖有表、各個(gè)部分還分小標(biāo)題。我們是一段一段寫(xiě),每一段都有提示詞,每一段都有寫(xiě)作標(biāo)準(zhǔn),每一段都有自動(dòng)化審核的系統(tǒng)。寫(xiě)完之后,我們還要AI去審核判斷是否符合需求。”
提示詞是達(dá)觀數(shù)據(jù)事前內(nèi)置還是內(nèi)置后由客戶修改?陳運(yùn)文表示:“會(huì)提前內(nèi)置我們覺(jué)得很好的提示詞,客戶也會(huì)根據(jù)需求疊加修改。提示詞既有代碼,也有自然語(yǔ)言。”
自大模型火熱起來(lái)之后,通用大模型與專(zhuān)業(yè)大模型之爭(zhēng)便一直持續(xù),陳運(yùn)文也給出了他的見(jiàn)解。
陳運(yùn)文表示:“曹植大模型是垂直專(zhuān)用大模型,喂的是專(zhuān)用知識(shí)。通用大模型有點(diǎn)像一個(gè)985的名校本科生,很聰明,綜合能力也很強(qiáng),各種知識(shí)都懂一些。你問(wèn)他各種知識(shí),也能回復(fù)得很好。但大學(xué)畢業(yè)生在專(zhuān)業(yè)崗位方面還缺乏培訓(xùn),比如銀行對(duì)公信貸業(yè)務(wù),還需要上崗前專(zhuān)業(yè)知識(shí)的培訓(xùn)。以前這個(gè)專(zhuān)業(yè)崗位上,別人是怎么寫(xiě)報(bào)告的、寫(xiě)作要求是什么樣的。并且需要懂對(duì)公信貸業(yè)務(wù)、同業(yè)拆借等等。”
簡(jiǎn)而言之,通用大模型是985本科生,而“曹植”這類(lèi)專(zhuān)業(yè)大模型是進(jìn)一步做了上崗前培訓(xùn)。
陳運(yùn)文舉例:“比如說(shuō),我們給它導(dǎo)入的是工業(yè)制造領(lǐng)域的工藝工序、設(shè)備操作、產(chǎn)品手冊(cè)等等這些專(zhuān)業(yè)的文檔,大模型學(xué)完以后,生成出來(lái)的報(bào)告才是專(zhuān)業(yè)領(lǐng)域所要求的報(bào)告。”
那么,專(zhuān)用大模型相比通用大模型,是在語(yǔ)料輸入方面存在差異,還是在語(yǔ)料、算法方面都作出改變?
陳運(yùn)文表示,在算法和產(chǎn)品形態(tài)兩個(gè)方面都作出了改進(jìn)。“如果我讓你寫(xiě)一個(gè)100頁(yè)的報(bào)告,一問(wèn)一答式怎么幫你寫(xiě)呀?”他笑稱。
因此,他總結(jié):“所以我們講,真正在專(zhuān)業(yè)領(lǐng)域,它的產(chǎn)品形態(tài)跟消費(fèi)者使用的一問(wèn)一答式是不一樣的。我們這個(gè)系統(tǒng)要更專(zhuān)業(yè)、更垂直化,然后才能解決大模型幻覺(jué)問(wèn)題。我覺(jué)得曹植大模型與ChatGPT最大的區(qū)別,就在于我們強(qiáng)調(diào)專(zhuān)業(yè)化、強(qiáng)調(diào)人機(jī)協(xié)同。”
封面圖片來(lái)源:視覺(jué)中國(guó)-VCG41N1188747468
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP