每日經(jīng)濟新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

專訪|恒生電子首席科學(xué)家白碩:金融大模型應(yīng)用生態(tài)仍有很大發(fā)展空間

每日經(jīng)濟新聞 2023-10-22 15:14:16

◎恒生電子首席科學(xué)家、大模型產(chǎn)品總監(jiān)白碩說:“站在大模型的角度,所有的插件都是工具;站在我們的角度,這些都是我們大模型生態(tài)的一部分。”

每經(jīng)記者 葉曉丹    每經(jīng)編輯 張海妮    

10月19日,恒生電子(600570.SH,股價29.92元,市值568.48億元)發(fā)布了金融大模型LightGPT最新的能力升級成果,以及基于LightGPT打造的多款光子系列大模型應(yīng)用產(chǎn)品,并宣布正式開放產(chǎn)品公測。

恒生電子董事長劉曙峰表示,當(dāng)前金融行業(yè)對于大模型技術(shù)的關(guān)注度和參與度很高,但在大模型實際落地過程中主要存在模型選擇難、算力供應(yīng)不足、應(yīng)用成熟度不足等問題,建議機構(gòu)可以通過選擇合適的金融大模型,采用大模型“私有化+MaaS服務(wù)”混合部署,基于場景驅(qū)動的金融垂直應(yīng)用開發(fā)和積累數(shù)據(jù)資產(chǎn)、構(gòu)建數(shù)據(jù)飛輪、提升應(yīng)用成熟度等工作,實現(xiàn)金融行業(yè)大模型更好的應(yīng)用落地。

恒生電子首席科學(xué)家、大模型產(chǎn)品總監(jiān)白碩介紹,此次升級的LightGPT,面向金融機構(gòu)實現(xiàn)LightGPT-7B的開源,推理和訓(xùn)練全面適配華為昇騰系列。

恒生電子推出金融大模型,背后經(jīng)歷了怎樣的轉(zhuǎn)向?落地應(yīng)用金融行業(yè),金融大模型具備哪些共通性和特殊性?當(dāng)前大模型所需的AI算力,在國際半導(dǎo)體行業(yè)政策風(fēng)聲鶴唳之際,將面臨怎樣的連鎖反應(yīng)?

在此次發(fā)布會之際,《每日經(jīng)濟新聞》(以下簡稱NBD)記者專訪了恒生電子首席科學(xué)家、大模型產(chǎn)品總監(jiān)白碩。

白碩 圖片來源:受訪對象供圖

禁令之下國內(nèi)AI芯片危機互現(xiàn)

NBD:最近大家關(guān)注度比較高的是美國半導(dǎo)體禁令,新規(guī)可能會沖擊英偉達A800或者H800的銷售,對國內(nèi)AI芯片或帶來沖擊,怎么看這一禁令后續(xù)對大模型行業(yè)帶來的連鎖反應(yīng)?

白碩:我理解這可能會帶來幾方面影響:第一,由于禁令的生效,國內(nèi)大模型企業(yè)可能打算買的或者已經(jīng)在路上的AI芯片,都可能存在一定的風(fēng)險。買不到當(dāng)然就是“無米之炊”,大模型企業(yè)想推廣的一些場景可能面臨不方便推廣或者沒有那么順利的問題。

挑戰(zhàn)也帶來了另一方面的影響:一方面,國產(chǎn)相應(yīng)GPU可以快速頂上,達到同步、同功能、等效的替換。站在這個角度上,確實我們看到一些企業(yè),譬如海光、華為的昇騰都在發(fā)力,我也期待他們會提供更加符合客戶要求的算力支持,我們也會一起幫助AI的應(yīng)用真正在行業(yè)落地。所以從這一方面來看,其實它是一個機會,推動國產(chǎn)GPU的技術(shù)進步。

此外,未來還會不會有另外一種可能性,當(dāng)前國內(nèi)大模型已經(jīng)有的算力,可能處于一種分散的狀態(tài),不一定能夠發(fā)揮它最大的效能,已經(jīng)有的算力掌握在少數(shù)單位或者少數(shù)機構(gòu)的手里,并不能非常充分地發(fā)揮它的作用。我們有沒有可能把算力集中起來,以行業(yè)的方式,統(tǒng)一提供服務(wù)?這也是我們在思考的一條路徑。

NBD:目前國內(nèi)有多家金融機構(gòu)研發(fā)自己的大模型技術(shù),但大模型的開發(fā)需要大量資金、算力和數(shù)據(jù)的支撐,也對研發(fā)企業(yè)的實力提出了挑戰(zhàn),大模型技術(shù)未來是否會進一步拉大頭部和中小金融機構(gòu)之間的技術(shù)差距?

白碩:如果從算力角度來看,不同規(guī)模金融機構(gòu)在算力方面投入的差距,可能很大程度上會使這個差距加劇,對算力投入成本的承受程度各不相同。但是,如果可以通過行業(yè)能力統(tǒng)一的方式來提供算力服務(wù),大家或許都有機會。

另一方面,實際上大模型的預(yù)訓(xùn)練、精調(diào)和推理部署需要的算力有數(shù)量級的差別。實力雄厚的頭部企業(yè)研發(fā)投入充足,先發(fā)優(yōu)勢明顯,可以利用相對大的算力和自有數(shù)據(jù)對大模型進行精調(diào);而研發(fā)投入相對有限的中小機構(gòu),可以采用跟隨策略,直接使用成熟模型,只進行推理部署而不做精調(diào)。像恒生這樣的金融科技服務(wù)商,可以在打造成熟模型方面為市場提供相應(yīng)服務(wù)。

金融大模型應(yīng)用生態(tài)仍有很大發(fā)展空間

NBD:恒生電子劉曙峰董事長提到了金融大模型的三個難點,模型選擇難、算力訓(xùn)練難、質(zhì)量控制難。目前大模型還面臨哪些挑戰(zhàn)?在語料大數(shù)據(jù)上,如何做好成本和質(zhì)量上的平衡?此前,有數(shù)據(jù)行業(yè)人士提出一種方案:在相對垂直的領(lǐng)域,能不能通過提升語料的精度,優(yōu)化大模型運行所需算力消耗?對此,您怎么看?

白碩:我覺得提升語料精度還不完全,這只是極小一部分。生態(tài)里有一些更合適的環(huán)節(jié)去承載精準(zhǔn)的數(shù)據(jù),而大模型只需要跟它對接,對接好了,質(zhì)量自然就會提升。今天我們已經(jīng)看到了在大模型上,無論是實時行情的插件還是精準(zhǔn)規(guī)則的插件,都起到重要的作用。

還有一些數(shù)據(jù)是直接從應(yīng)用系統(tǒng)里調(diào)出來的,這也是非常精準(zhǔn)的,也是實時的。提升大模型整體表現(xiàn),需要端到端地來看,讓合適的組件提供合適的服務(wù),構(gòu)筑全面的生態(tài)。

NBD:它又給大模型應(yīng)用層帶來了很大的空間?

白碩:是的,可能很多通用領(lǐng)域的大模型供應(yīng)商不會這么想,他們想的是怎么把別人的插件變成自己附屬的一部分。但恒生這次推出的“光子”,定位金融應(yīng)用對接大模型的“中控”部位,串聯(lián)了通用工具鏈、金融插件工具、金融數(shù)據(jù)和金融業(yè)務(wù)場景,包括大模型也是它的一個組件,我們并不認(rèn)為大模型就是核心。(備注:“光子”系恒生電子于今年6月推出的金融智能助手)

說到這里,這件事情怎么做更好,腦洞可以開得更大一點。推動大模型本身的技術(shù)進步和數(shù)據(jù)質(zhì)量的提升只是一個手段,其他的手段還包括把更優(yōu)質(zhì)的數(shù)據(jù)放到更合適的部位,加強大模型跟其他組件的對接能力,而不是讓大模型無所不能,這樣才能構(gòu)筑良好的大模型生態(tài)。

強烈的危機感,推動我們從“小模型”轉(zhuǎn)向“大模型”

NBD:恒生推出的金融大模型LightGPT“私有化+MaaS服務(wù)”混合部署,提到了私有化數(shù)據(jù)私有化部署,共有數(shù)據(jù)公有云模式,私有云、混合云、公有云多種部署方式并存,這是基于金融行業(yè)的特色化布局?

白碩:不僅是金融行業(yè),所有需要強監(jiān)管、所有要求“家里有數(shù)”的機構(gòu)都是一個道理,數(shù)據(jù)放出去,價值就不是你的了,只有在你手里,才是你的價值。如果這樣的數(shù)據(jù)不和大模型結(jié)合,可能挖掘不出比較深的價值。所以,“家里”的數(shù)據(jù)和大模型的語言能力,加上通用的能力完整地結(jié)合,并不是把所有的能力壓在一端,這個生態(tài)本身就是廣義的。

站在大模型的角度,所有的插件都是工具;站在我們的角度,這些都是我們大模型生態(tài)的一部分。

NBD:恒生在這個時點推出金融大模型,基于哪些方面的考慮?

白碩:首先,一直以來恒生不僅是資本市場傳統(tǒng)的IT系統(tǒng)供應(yīng)商、金融數(shù)據(jù)提供商,也是資本市場重要的AI應(yīng)用供應(yīng)商。如智能客服、智能文檔、智能投研等智能應(yīng)用,類似這樣的工作已經(jīng)開展多年了,不是有大模型之后才入場的,我們原來就是這樣的技術(shù)廠商。

總體來說,恒生和恒生旗下金融數(shù)據(jù)服務(wù)子公司恒生聚源都是這個戰(zhàn)場上很長時間的一個玩家。即使人工智能在金融應(yīng)用方面,也是一個很長時間的玩家。所以,我們知道這里面的行業(yè)痛點,也知道大模型技術(shù)出來以后,對我們意味著什么。

首先是在我們內(nèi)部發(fā)生了一個轉(zhuǎn)向:從以前依靠小模型轉(zhuǎn)到依靠大模型,這個是最根本的。

傳統(tǒng)模型或者說“小模型”,采用的是AI模型框架,為這個模型提供專用的數(shù)據(jù),甚至是標(biāo)注數(shù)據(jù),訓(xùn)練出來是一個個“煙囪”。這些參數(shù)別的系統(tǒng)不能用,這些系統(tǒng)想要獲得AI的能力,還得再去做獨立的數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注和深度學(xué)習(xí),這些是傳統(tǒng)行業(yè)的特征。

而AI大模型是大規(guī)模預(yù)訓(xùn)練的,也就是說是大數(shù)據(jù)一次性灌到參數(shù)里,再經(jīng)過一些精調(diào),它可以同時適用于多個應(yīng)用領(lǐng)域和多項AI任務(wù)。這些應(yīng)用領(lǐng)域不需要再做大規(guī)模數(shù)據(jù)標(biāo)注,只需要在任務(wù)精調(diào)環(huán)節(jié)做少量的數(shù)據(jù)標(biāo)注,這是一個特別大的變化。

從傳統(tǒng)人工智能或者小模型,轉(zhuǎn)到現(xiàn)在的大模型,某種意義上相當(dāng)于否定自己,我們有強烈的危機感,所以整個團隊內(nèi)部的轉(zhuǎn)向是一個非常痛苦的過程。同時,這也意味著驅(qū)動我們轉(zhuǎn)型的動力非常足,干勁也非常高,團隊的共識也非常凝聚。

封面圖片來源:受訪對象供圖

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

大模型 恒生電子 軟件開發(fā) 浙江省 互聯(lián)網(wǎng)金融 國產(chǎn)軟件 電子

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人 在线 免费