每日經(jīng)濟(jì)新聞 2023-07-27 20:20:41
◎大模型是金融風(fēng)控的新趨勢(shì),每日經(jīng)濟(jì)新聞?dòng)浾邔TL了騰訊云天御首席科學(xué)家李超,探討了金融風(fēng)控大模型的技術(shù)原理、應(yīng)用價(jià)值和發(fā)展前景。
◎金融風(fēng)控大模型的應(yīng)用效果是顯著的,相比傳統(tǒng)的風(fēng)控建模方案,一般會(huì)有20%左右的反欺詐效果提升,建模時(shí)間也從2周縮短到2天。同時(shí),大模型也能夠解決小樣本和泛化性的問題,提高模型的穩(wěn)定性和可用性。
每經(jīng)記者 潘婷 每經(jīng)編輯 張益銘
年初,ChatGPT的的橫空出世引發(fā)一系列AI領(lǐng)域的連鎖反應(yīng),大模型如何才能和各行業(yè)結(jié)合,解決產(chǎn)業(yè)難題成為各界關(guān)注的焦點(diǎn)問題。金融行業(yè)作為天然數(shù)據(jù)密集型行業(yè),也是人工智能應(yīng)用最早和最普遍的行業(yè),加之金融機(jī)構(gòu)從高利率高風(fēng)險(xiǎn)的運(yùn)營(yíng)模式轉(zhuǎn)化為精細(xì)化的運(yùn)營(yíng)模式,獲客方式、風(fēng)控策略差異化加大,這也導(dǎo)致風(fēng)控領(lǐng)域成為觀察大模型落地的重要場(chǎng)景。
金融風(fēng)控由“規(guī)則對(duì)抗”進(jìn)入“模型對(duì)抗”怎么理解?不同金融機(jī)構(gòu)對(duì)大模型的接受程度如何?風(fēng)控大模型對(duì)于金融機(jī)構(gòu)風(fēng)控性能的提升有沒有一些可以量化的指標(biāo)來評(píng)判?風(fēng)控大模型是如何嵌入金融機(jī)構(gòu)場(chǎng)景的?帶著上述問題,每日經(jīng)濟(jì)新聞?dòng)浾邔TL了騰訊云天御首席科學(xué)家李超,以下NBD代表每日經(jīng)濟(jì)新聞。
騰訊云天御首席科學(xué)家 李超 受訪者供圖
NBD:金融風(fēng)控由“規(guī)則對(duì)抗”進(jìn)入“模型對(duì)抗”是怎么理解的?
李超:“模型應(yīng)用,產(chǎn)業(yè)先行”正在成為大模型應(yīng)用的共識(shí),這在金融行業(yè)體現(xiàn)的尤為明顯。金融行業(yè)作為天然的數(shù)據(jù)密集型行業(yè),又是人工智能應(yīng)用最早和最普遍的行業(yè),無疑是大模型落地的最佳場(chǎng)景。但金融行業(yè)對(duì)信息的高精度的要求和嚴(yán)苛的數(shù)據(jù)合規(guī)要求,讓行業(yè)大模型在金融場(chǎng)景的落地需要貼合自身發(fā)展現(xiàn)狀。
作為金融行業(yè)的“命門”,風(fēng)控基本完成了從人工審核到智能風(fēng)控的變化。由于貸款業(yè)務(wù)線上化、數(shù)字化以后,人工審批的效率遠(yuǎn)遠(yuǎn)不能滿足業(yè)務(wù)發(fā)展,于是以機(jī)器學(xué)習(xí)模型為代表的人工智能審核成為金融風(fēng)控的重要手段和構(gòu)成部分。風(fēng)控模型就是把專家經(jīng)驗(yàn)抽象成一系列風(fēng)控策略集,提升判斷風(fēng)險(xiǎn)的效率。譬如欺詐檢測(cè)模型、準(zhǔn)入模型、風(fēng)險(xiǎn)定價(jià)模型、額度管理等貫穿金融信貸業(yè)務(wù)的全生命周期。可以說,風(fēng)控模型是金融風(fēng)控體系的技術(shù)核心。
傳統(tǒng)的風(fēng)控模型主要依托于金融機(jī)構(gòu)的歷史金融數(shù)據(jù)和專家經(jīng)驗(yàn),呈現(xiàn)出“靜態(tài)模型+動(dòng)態(tài)策略規(guī)則”的特征,即整體風(fēng)控模型的框架不變,調(diào)整具體策略的閾值,例如以前針對(duì)有過三次逾期記錄的用戶申請(qǐng)不予通過,現(xiàn)在有可能根據(jù)欺詐態(tài)勢(shì)調(diào)整為有過一次逾期記錄的才不予通過。但在金融機(jī)構(gòu)面臨的內(nèi)外部趨勢(shì)變化下,金融機(jī)構(gòu)不僅要敏捷迭代策略,還要迭代模型本身,構(gòu)建以“動(dòng)態(tài)模型+動(dòng)態(tài)策略規(guī)則”為代表的“模型對(duì)抗”能力。
NBD:做大模型要有海量的數(shù)據(jù),那我們的數(shù)據(jù)來源有哪些?是由金融機(jī)構(gòu)授權(quán)后我們?cè)偃メ槍?duì)性的建模,還是會(huì)有一個(gè)普適性的模型去應(yīng)對(duì)?
李超:關(guān)于大模型這件事,目前在行業(yè)里邊討論的比較多的是大語(yǔ)言模型(LLMS),就是ChatGPT,也是讓這件事情得到大家更深入的關(guān)注。ChatGPT本身是一個(gè)大語(yǔ)言模型,它是無監(jiān)督的自然語(yǔ)言處理分析的模型,用來解決聊天機(jī)器人這樣一些場(chǎng)景。
今天我們討論的金融風(fēng)控大模型,依托騰訊云行業(yè)大模型和騰訊安全20多年黑灰產(chǎn)對(duì)抗經(jīng)驗(yàn)沉淀,主要解決的問題并不是偏文本分析的場(chǎng)景,而是關(guān)于金融風(fēng)控的欺詐識(shí)別大模型,本身是機(jī)器學(xué)習(xí)模型,并不是大語(yǔ)言模型。這個(gè)東西在訓(xùn)練的時(shí)候,更多應(yīng)用了金融風(fēng)控場(chǎng)景里面特有的風(fēng)控樣本。
我們最早做定制化服務(wù)的時(shí)候,其實(shí)并沒有通過大模型,也就是基于Foundation model+遷移學(xué)習(xí)的機(jī)制,客戶會(huì)根據(jù)自身客戶收集的樣本來去構(gòu)建垂直場(chǎng)景的風(fēng)控模型。雖然能夠?qū)崿F(xiàn)定制化的欺詐模式識(shí)別,但是在這過程中也發(fā)現(xiàn)通??蛻糇陨矸e累的樣本能力和速度是非常局限的,單純用傳統(tǒng)的機(jī)器學(xué)習(xí)方式給客戶做模型的構(gòu)建,很難去建設(shè)好既精準(zhǔn)又穩(wěn)定的風(fēng)控模型。
基于我們?cè)谌斯ぶ悄芩惴ú粩嗟纳钊胙芯?,開始用到遷移學(xué)習(xí)的機(jī)制,逐漸發(fā)展到成為新一代基于大模型的模型對(duì)抗范式。它最主要的特點(diǎn)就是能夠根據(jù)過往我們所積累的黑灰產(chǎn)一些樣式和一些模型,把其中有用的知識(shí)通過知識(shí)蒸餾的方式收取出來,通過技術(shù)的手段,把這些知識(shí)形成基礎(chǔ)模型,叫做Foundation model,F(xiàn)oundation model不同于一個(gè)通用模型,不需要直接去服務(wù)具體的場(chǎng)景,而是一個(gè)知識(shí)庫(kù)。在這個(gè)“知識(shí)庫(kù)”基礎(chǔ)上,客戶基于一些樣本提示,就能夠靈活地生成適配各個(gè)場(chǎng)景和不同金融機(jī)構(gòu)的風(fēng)控模型。
NBD:風(fēng)控大模型對(duì)于銀行、消金、互金這些金融機(jī)構(gòu)風(fēng)控性能的提升有沒有一些可以量化的指標(biāo)來評(píng)判?
李超:客戶通過金融風(fēng)控大模型來構(gòu)建風(fēng)控模型相比傳統(tǒng)的風(fēng)控建模方案,一般會(huì)有20%左右的反欺詐效果提升,建模時(shí)間也就是從樣本收集、模型訓(xùn)練到部署上線的過程從以前的2周到現(xiàn)在僅需要2天。
另外,大模型讓定制建模變得更加可行。在客戶樣本非常少或者沒有的情況下,我們也能進(jìn)行定制建模,同時(shí)這種定制建模的穩(wěn)定性會(huì)比傳統(tǒng)模型更穩(wěn)定、更可用。所以這種大模型的核心價(jià)值,更多是使定制建模成為可能。
以某金融客戶為例,建模效率提升60%。該金融機(jī)構(gòu)自身渠道和客群變化比較快,客戶的風(fēng)控團(tuán)隊(duì)遵循風(fēng)險(xiǎn)動(dòng)態(tài)治理的風(fēng)控理念,需不斷根據(jù)風(fēng)險(xiǎn)的變化迭代風(fēng)控模型。然而基于傳統(tǒng)的專家聯(lián)合建模方式在效率和成本上都難以滿足客戶需求,騰訊云助力該客戶實(shí)現(xiàn)了全流程自動(dòng)化的風(fēng)控建模,模型迭代周期從17天縮短到3天,風(fēng)控模型迭代效率得到了極大的提升。
另外,某銀行客戶在小樣本條件下建模性能提升20.5%,該客戶因業(yè)務(wù)冷啟動(dòng)階段欺詐樣本積累不足,在風(fēng)控建模階段面臨小樣本訓(xùn)練難題,傳統(tǒng)風(fēng)控建模方式難以滿足客戶對(duì)模型性能的要求。使用金融風(fēng)控大模型,客戶基于少量提示樣本就遷移得到適配自身業(yè)務(wù)場(chǎng)景的定制模型,相比于傳統(tǒng)的建模方式模型KS(Kolmogorov-Smirnov,區(qū)分度)性能提升20.5%,在跨場(chǎng)景的泛化性測(cè)試上性能提升53%。
NBD:這個(gè)模型具體是怎么運(yùn)作的?怎么嵌入金融機(jī)構(gòu)場(chǎng)景的?
李超:我們首先是用一種對(duì)抗學(xué)習(xí)的方式把所有模型里面的有用知識(shí)抽取出來,再通過知識(shí)蒸餾的方式把這些有用的知識(shí)融合進(jìn)一個(gè)Foundation model,基于這個(gè)大基礎(chǔ)模型就能夠快速生產(chǎn)出來新的模型。
當(dāng)過往的知識(shí)越來越多的時(shí)候,對(duì)于場(chǎng)景樣本的需求就會(huì)越來越少。大模型的整個(gè)邏輯,就是把過往所有知識(shí)全部加工在Foundation model里,這個(gè)Foundation model好比一個(gè)能夠自動(dòng)生產(chǎn)模型的機(jī)器人,只需要給它小量的場(chǎng)景樣本提示,就能夠生產(chǎn)出來對(duì)應(yīng)場(chǎng)景的專屬模型出來。生成的模型既有比較好的場(chǎng)景欺詐識(shí)別效果,又具備了通識(shí)能力,即模型泛化性。
從金融場(chǎng)景整體來看,目前更多場(chǎng)景是以貸前為主,貸中逐漸多了起來,貸后遇到的相對(duì)還是少一些。比較有代表性的是一些消金、互金公司,他們對(duì)審批流程做了很精細(xì)化的管理之后,在審批流程的很多環(huán)節(jié)都開始應(yīng)用AI建模形式。因此也就有了定制建模的需求,貫穿在客戶風(fēng)險(xiǎn)審批整個(gè)生命周期,比如反欺詐、客戶分層、撈回、定額、定價(jià),在很多環(huán)節(jié)都可以用大模型定制的方式。
NBD:在服務(wù)金融機(jī)構(gòu)過程中,比如說銀行、消金、互金,在服務(wù)的過程中,他們對(duì)于風(fēng)控大模型的需求有沒有哪些異同點(diǎn)是比較突出的?
李超:以我的經(jīng)驗(yàn)來看,互金和消金對(duì)于新技術(shù)的應(yīng)用比銀行會(huì)更早一點(diǎn),相對(duì)來說銀行會(huì)更晚進(jìn)入新技術(shù)應(yīng)用的時(shí)期。
目前我們看到的是,整個(gè)銀行業(yè)已經(jīng)開始應(yīng)用機(jī)器學(xué)習(xí),不再像過去那樣單一傳統(tǒng)的線下手段或者評(píng)測(cè)的手段,已經(jīng)廣泛應(yīng)用到機(jī)器學(xué)習(xí)模型評(píng)分機(jī)制,但是很多還沒有建立起真正的敏捷迭代的動(dòng)態(tài)風(fēng)險(xiǎn)管理迭代機(jī)制。當(dāng)一個(gè)風(fēng)控模型上線之后,不會(huì)輕易去進(jìn)行更新。
互金公司的模型定制化需求是非常旺盛的,更愿意去嘗試新的模型,消金介于銀行和互金之間。很多互金公司、消金公司,他們的模型迭代非常快,有些3個(gè)月或者1個(gè)月就會(huì)迭代。很多互金公司,對(duì)不同金融產(chǎn)品不同渠道不同業(yè)務(wù)流程,都會(huì)做很多定制化的模型。
最近一年,很多金融機(jī)構(gòu)已經(jīng)開始意識(shí)到小樣本的問題,他們發(fā)現(xiàn)定制出來的模型很快就會(huì)效果衰竭,所以模型需要非??焖俚牡?,很大的原因就是小樣本問題。
大模型出來后,很多金融機(jī)構(gòu)更愿意使用大模型去構(gòu)建更穩(wěn)定的定制化模型,我們會(huì)把泛化能力更強(qiáng)、更廣泛、多樣化的信息給融合在模型里,消金、互金更多會(huì)使用大模型機(jī)制去實(shí)現(xiàn)模型快速迭代。
封面圖片來源:視覺中國(guó)-VCG211323198264
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP