2023-09-07 15:22:05
9月7日,2023騰訊全球數(shù)字生態(tài)大會(huì)在深圳國(guó)際會(huì)展中心舉行,聚焦產(chǎn)業(yè)未來(lái)發(fā)展新趨勢(shì)以及自研技術(shù)產(chǎn)品的最新進(jìn)展,展示了全方位的行業(yè)前沿與智慧洞見。在行業(yè)大模型及智能應(yīng)用專場(chǎng)上,騰訊云副總裁、騰訊云智能研發(fā)負(fù)責(zé)人、騰訊企點(diǎn)研發(fā)負(fù)責(zé)人吳永堅(jiān)發(fā)表《MaaS助力應(yīng)用升級(jí)重塑智能時(shí)代生產(chǎn)力》主題演講?;贏I大模型技術(shù),騰訊云更新升級(jí)近10款智能應(yīng)用和解決方案,進(jìn)一步加快模型產(chǎn)業(yè)落地。
騰訊云副總裁、騰訊云智能研發(fā)負(fù)責(zé)人、騰訊企點(diǎn)研發(fā)負(fù)責(zé)人吳永堅(jiān)
吳永堅(jiān)認(rèn)為,AI大模型應(yīng)用,催生“效率革命”,讓智能應(yīng)用表現(xiàn)出更強(qiáng)的能力、更高的效率。例如,在AIGC應(yīng)用方面,騰訊混元大模型正式通過(guò)騰訊云對(duì)外開放,用戶可以通過(guò)自然語(yǔ)言給模型輸入內(nèi)容生成指令,提升文案創(chuàng)作效率。依托騰訊自研的AI繪畫模型,騰訊云AI繪畫實(shí)現(xiàn)輸入文本、圖片智能生成圖像,支持超過(guò)25種繪畫風(fēng)格,共同為高質(zhì)量、高效率的內(nèi)容創(chuàng)作提供支持,加快在內(nèi)容社區(qū)、電商等場(chǎng)景落地。
同時(shí),騰訊云依托行業(yè)大模型解決方案,提升了圖像識(shí)別、數(shù)據(jù)分析、人機(jī)交互等多款智能應(yīng)用生產(chǎn)效率,將更多元化的,即插即用的產(chǎn)品、服務(wù)推向市場(chǎng),重塑智能時(shí)代生產(chǎn)力。
吳永堅(jiān)介紹,在圖像識(shí)別領(lǐng)域,TI-OCR訓(xùn)練平臺(tái)集成OCR大模型,借助端到端算法,助力客戶解決特定場(chǎng)景識(shí)別難題,減少訓(xùn)練成本和訓(xùn)練時(shí)長(zhǎng);在數(shù)據(jù)分析領(lǐng)域,騰訊企點(diǎn)分析·AI助手通過(guò)分析大模型,實(shí)現(xiàn)零門檻對(duì)話式分析,讓人人都能擁有專業(yè)數(shù)據(jù)分析能力,為業(yè)務(wù)一線提供決策支持。在人機(jī)交互方面,通過(guò)行業(yè)大模型中樞,對(duì)接海量知識(shí)和工具,實(shí)現(xiàn)文字、語(yǔ)言、視頻等多模態(tài)意圖理解,生成智能、精準(zhǔn)答案輸出,支持更智能、更高效、更自然的智能客服、AI助手、數(shù)智人應(yīng)用落地。
吳永堅(jiān)表示,未來(lái)騰訊云將繼續(xù)推動(dòng)AI大模型等先進(jìn)技術(shù),應(yīng)用于內(nèi)部PaaS、SaaS產(chǎn)品,驗(yàn)證MaaS服務(wù)的可用性、易用性。另一方面,也將持續(xù)打造更多開箱即用的AI大模型產(chǎn)品、服務(wù),打通AI產(chǎn)業(yè)落地全鏈條,助力客戶實(shí)現(xiàn)數(shù)智化升級(jí)。
以下為吳永堅(jiān)主題演講內(nèi)容整理:
各位線上的觀眾、媒體朋友們,大家好!我是騰訊的吳永堅(jiān),今天我分享的主題是《MaaS助力應(yīng)用升級(jí)重塑智能時(shí)代生產(chǎn)力》。
今年6月,我們正式發(fā)布了騰訊云行業(yè)大模型解決方案,助力客戶將AI大模型應(yīng)用于產(chǎn)業(yè)場(chǎng)景。與此同時(shí),我們也推動(dòng)內(nèi)部實(shí)踐,基于行業(yè)大模型,推出騰訊企點(diǎn)智能客服、企點(diǎn)AI助手兩款產(chǎn)品,通過(guò)技術(shù)創(chuàng)新解決智能客服“不智能”,數(shù)據(jù)分析門檻高的難題。
隨后,我們將AI大模型能力應(yīng)用到更廣泛的PaaS、SaaS產(chǎn)品。一方面,驗(yàn)證我們MaaS服務(wù)的可用性、易用性。另一方面,也將更多開箱即用的產(chǎn)品、服務(wù),向客戶開放,推動(dòng)大模型在實(shí)際生產(chǎn)、運(yùn)營(yíng)場(chǎng)景發(fā)揮效用。
今天,借數(shù)字生態(tài)大會(huì),和大家分享一下我們的最新實(shí)踐。
依托騰訊云多年深耕產(chǎn)業(yè)互聯(lián)網(wǎng)的經(jīng)驗(yàn),我們從產(chǎn)業(yè)需求出發(fā),基于自研騰訊混元大模型,同時(shí)支持主流開源模型應(yīng)用,在TI平臺(tái)內(nèi)置高質(zhì)量行業(yè)大模型,為客戶提供不同規(guī)模的模型服務(wù)。通過(guò)升級(jí)大模型訓(xùn)練、精調(diào)工具鏈,助力企業(yè)快速生成專屬模型,升級(jí)智能應(yīng)用,加快模型產(chǎn)業(yè)落地。
首先和大家分享,我們基于騰訊混元大模型,在AIGC應(yīng)用方面的探索。
過(guò)去,在文案創(chuàng)作場(chǎng)景,傳統(tǒng)創(chuàng)作以“人工”為核心,容易產(chǎn)生創(chuàng)意不足、時(shí)效性不足、質(zhì)量不可控等問題。今天,騰訊混元大模型正式通過(guò)騰訊云對(duì)外開放,用戶可以通過(guò)自然語(yǔ)言給模型輸入內(nèi)容生成指令,提升文案創(chuàng)作效率;通過(guò)參數(shù)選擇、多輪輸入,對(duì)生成內(nèi)容進(jìn)行控制、調(diào)優(yōu),提升文案創(chuàng)作效果;根據(jù)營(yíng)銷、創(chuàng)作、效率等不同場(chǎng)景需求,生成對(duì)應(yīng)專屬內(nèi)容,提升文案可用性。同時(shí),還可以與廣告平臺(tái)、UGC平臺(tái)、SaaS服務(wù)實(shí)現(xiàn)快速連接,加速落地,為各類場(chǎng)景提供更精準(zhǔn)、高效的商業(yè)文案創(chuàng)作工具。
同樣,傳統(tǒng)繪畫創(chuàng)作,也需要耗費(fèi)大量的時(shí)間和精力,并且嚴(yán)重依賴于創(chuàng)作者的專業(yè)水平和主觀經(jīng)驗(yàn),給企業(yè)帶來(lái)較大的運(yùn)營(yíng)成本。我們推出騰訊云AI繪畫,輸入文本、圖片即可智能生成圖像,支持超過(guò)25種繪畫風(fēng)格。值得注意的是,依托騰訊自研的AI繪畫模型,騰訊云AI繪畫具有強(qiáng)大的中文理解能力,可以更好地支持中文元素的圖像生成,例如古詩(shī)詞理解、水墨剪紙等;我們也大幅降低了API接口耗時(shí),相較業(yè)內(nèi)平均水平降低50%,為高質(zhì)量、高效率的內(nèi)容創(chuàng)作提供支持。
深入產(chǎn)業(yè),我們發(fā)現(xiàn)在內(nèi)容社區(qū)、電商等場(chǎng)景,圖文結(jié)合的形式,可以提供更豐富、更個(gè)性、更有創(chuàng)意的廣告信息,有效提升轉(zhuǎn)化率?;趧倓偨榻B的兩種方式,用戶只需輸入主題和產(chǎn)品描述,即可一鍵生成種草文案、商品詳情描述等內(nèi)容。AI繪畫,還可以在內(nèi)容配圖,宣傳海報(bào)等環(huán)節(jié),提供創(chuàng)意輔助,實(shí)現(xiàn)智能營(yíng)銷+智能創(chuàng)意雙重提效?,F(xiàn)在,歡迎大家申請(qǐng)?jiān)囉抿v訊混元大模型,也可以登錄騰訊云官網(wǎng)試用AI繪畫。
在此之外,今年6月,我們還公布了騰訊云行業(yè)大模型解決方案。
由大量專業(yè)知識(shí)學(xué)習(xí),以及強(qiáng)大推理能力,構(gòu)建出的專屬行業(yè)大模型,在特定領(lǐng)域的表現(xiàn)力及適應(yīng)性更強(qiáng)。基于此,我們進(jìn)一步提升了圖像識(shí)別、數(shù)據(jù)分析、數(shù)智人、客服等智能應(yīng)用生產(chǎn)效率,將更多元化的,即插即用的產(chǎn)品、服務(wù)推向市場(chǎng)。
在圖像識(shí)別領(lǐng)域,既往OCR文字識(shí)別,需要經(jīng)過(guò)圖片輸入、檢測(cè)、識(shí)別、結(jié)構(gòu)化等多個(gè)流程。一方面,多流程操作容易導(dǎo)致錯(cuò)誤累積,降低模型準(zhǔn)確率;另一方面,每一個(gè)業(yè)務(wù)場(chǎng)景的圖片識(shí)別需求有所不同,導(dǎo)致單一模型難以復(fù)用于新場(chǎng)景,每一次定制都需要增加成本。
升級(jí)為“端到端”的OCR大模型后,從圖像到文字,一步生成識(shí)別結(jié)果。比如,針對(duì)票據(jù)示例,可直接提問“委托日期是什么時(shí)候”,大模型在理解圖片后給出回答,大幅縮減識(shí)別流程,提升識(shí)別準(zhǔn)確度。針對(duì)發(fā)票混貼的場(chǎng)景下,一個(gè)模型可支持多種類型圖像識(shí)別,泛化性進(jìn)一步提高。
與傳統(tǒng)模型相比,OCR大模型突破技術(shù)局限,有效降低了落地成本。例如,針對(duì)手寫體,復(fù)雜表格難識(shí)別的問題,OCR大模型通過(guò)全面理解圖片,直接提取相關(guān)字段,提升識(shí)別準(zhǔn)確度;針對(duì)拍攝背景復(fù)雜的圖片,OCR大模型可以借助端到端算法,避開干擾信息,直接回答相關(guān)問題;針對(duì)訓(xùn)練成本,在特定場(chǎng)景下,傳統(tǒng)模型訓(xùn)練提升指標(biāo),需要依賴超過(guò)2000個(gè)訓(xùn)練樣本,48到60個(gè)小時(shí)訓(xùn)練,而OCR大模型,只需要50到100個(gè)訓(xùn)練樣本,訓(xùn)練2個(gè)小時(shí),即可實(shí)現(xiàn)3%到20%的效果提升。
目前,OCR大模型已經(jīng)集成到TI-OCR訓(xùn)練平臺(tái),供客戶依據(jù)自身業(yè)務(wù)場(chǎng)景,進(jìn)行小樣本精調(diào)使用。
以新能源領(lǐng)域?yàn)槔?,客戶通過(guò)TI-OCR訓(xùn)練平臺(tái)進(jìn)行圖片標(biāo)注,以小樣本企業(yè)數(shù)據(jù)對(duì)OCR大模型進(jìn)行精調(diào),實(shí)現(xiàn)對(duì)彎曲電線字符、水印銘牌、復(fù)雜電表圖片等識(shí)別,推動(dòng)自動(dòng)化信息審核。在OCR大模型輔助下,字符讀取準(zhǔn)確率達(dá)到98%以上,自動(dòng)化審核預(yù)計(jì)為客戶節(jié)省超過(guò)80%的人力投入。
在數(shù)據(jù)分析場(chǎng)景,當(dāng)用戶希望了解“最近的銷量情況”時(shí),傳統(tǒng)數(shù)據(jù)分析流程復(fù)雜,需要高度依賴專業(yè)人員,經(jīng)過(guò)分析思路拆解、數(shù)據(jù)指標(biāo)導(dǎo)入等環(huán)節(jié),才能生成結(jié)論,鏈路長(zhǎng)效率低。面對(duì)同一個(gè)問題,通用大模型因?yàn)槿狈Ψ治鰧I(yè)知識(shí)和洞察力,則容易生成冗余或無(wú)效的答案。
為此,我們打造了支持零門檻對(duì)話式數(shù)據(jù)分析的分析大模型。
和通用大模型相比,分析大模型內(nèi)化了專業(yè)的數(shù)據(jù)分析知識(shí)、不同行業(yè)的分析指標(biāo)體系,可以依據(jù)行業(yè)特點(diǎn)進(jìn)行意圖理解、思路拆解、數(shù)據(jù)推理,從分析師視角生成結(jié)論。
例如,通過(guò)分析大模型的意圖理解能力,銷量這個(gè)詞匯會(huì)被關(guān)聯(lián)為“銷售額”“訂單數(shù)”,“最近”被關(guān)聯(lián)為“近7天”,經(jīng)過(guò)與用戶交互,明確分析任務(wù)為近7天的訂單數(shù)趨勢(shì)。
通過(guò)分析大模型的數(shù)據(jù)推理能力,還將進(jìn)一步建議用戶從不同銷售渠道,分析訂單數(shù)變化原因。
基于分析大模型,我們升級(jí)推出騰訊企點(diǎn)分析AI助手,覆蓋對(duì)話式分析,輔助數(shù)據(jù)配置,提取智能結(jié)論、一鍵生成報(bào)告四大場(chǎng)景。今年9月,企點(diǎn)分析AI助手正式向大客戶開放內(nèi)測(cè)申請(qǐng)。未來(lái),人人都能擁有專業(yè)數(shù)據(jù)分析能力,讓數(shù)據(jù)跑得更快,為業(yè)務(wù)一線提供決策支持。
在人機(jī)交互方面,我們通過(guò)行業(yè)大模型中樞,對(duì)接海量知識(shí)和工具,實(shí)現(xiàn)文字、語(yǔ)言、視頻等多模態(tài)意圖理解,生成智能、精準(zhǔn)答案輸出。接下來(lái),我將詳細(xì)為大家介紹智能客服、語(yǔ)音助手、數(shù)智人方向的探索。
圍繞客服場(chǎng)景,今年6月騰訊企點(diǎn)發(fā)布全新一代智能客服,引入大模型能力,對(duì)對(duì)話交互、人工輔助和知識(shí)構(gòu)建三個(gè)層面進(jìn)行提升。最近,我們進(jìn)一步升級(jí)了管理端配置能力,提升知識(shí)構(gòu)建效率,優(yōu)化C端用戶體驗(yàn)。同時(shí),我們積極與各行各業(yè)進(jìn)行產(chǎn)業(yè)實(shí)踐,在文旅、泛政、地產(chǎn)等領(lǐng)域落地標(biāo)桿案例。
例如,在知識(shí)構(gòu)建方面,通過(guò)企業(yè)專屬知識(shí)“導(dǎo)入-校驗(yàn)-調(diào)優(yōu)”閉環(huán),可以提升復(fù)雜文檔讀取、理解效果,進(jìn)一步優(yōu)化冷啟動(dòng)效率,降低運(yùn)維成本。在文字文檔基礎(chǔ)上,我們?cè)黾恿藢?duì)圖文混排、多列排版等復(fù)雜文檔接入。通過(guò)語(yǔ)義切塊,生成向量,以高可用、可擴(kuò)展向量數(shù)據(jù)庫(kù)方案,豐富問答組合及內(nèi)容;通過(guò)快速生成問答對(duì),以及問答原文的回溯,提高問答校驗(yàn)的效率;通過(guò)提供對(duì)話測(cè)試和運(yùn)營(yíng)工具,讓運(yùn)營(yíng)人員快速實(shí)現(xiàn)調(diào)優(yōu),提升問答準(zhǔn)確率。
在對(duì)話交互層面,大模型迭代向量數(shù)據(jù)庫(kù)、搜索引擎能力,智能生成擬人化答案,可以讓智能客服應(yīng)對(duì)更復(fù)雜的需求。例如,傳統(tǒng)客服無(wú)法支持“操作步驟講解”這類復(fù)雜需求。新一代智能客服通過(guò)上下文信息補(bǔ)全,基于企業(yè)知識(shí)庫(kù)進(jìn)行問答推理,可以將復(fù)雜問題解決率提高30%。
在用戶體驗(yàn)上,大模型加持,也讓智能客服更接近“真人客服”。例如,可以準(zhǔn)確地識(shí)別用戶情緒,及時(shí)給出安撫??梢苑直嫒蝿?wù)型、知識(shí)型、閑聊型話題,通過(guò)聊天的方式解決任務(wù)需求。在圖片示例中,我們看到,即使在業(yè)務(wù)辦理過(guò)程中,用戶插入了“閑聊”話題,也不會(huì)導(dǎo)致任務(wù)中斷,保證了業(yè)務(wù)辦理成功率。
除了智能客服,出行大模型的引入,也極大提升了車載語(yǔ)音助手的語(yǔ)義理解能力、交互體驗(yàn)。
傳統(tǒng)車載語(yǔ)音助手,以規(guī)則+小模型的方式,理解用戶請(qǐng)求,存在對(duì)話呆板不自然、機(jī)械式回復(fù)無(wú)情感、功能單一等問題。加入大模型后,通過(guò)復(fù)雜意圖識(shí)別,提供更自然的對(duì)話能力;通過(guò)設(shè)定人設(shè),實(shí)現(xiàn)更富情感化的語(yǔ)音交互。同時(shí),隨著大模型能力迭代,將支持更多出行場(chǎng)景能力。
例如,基于出行大模型,通過(guò)簡(jiǎn)單提問,語(yǔ)音助手可以自動(dòng)生成行程規(guī)劃。根據(jù)車輛情況,語(yǔ)音助手會(huì)主動(dòng)提示加油,并在導(dǎo)航中添加沿途加油站。同時(shí),大模型也融合了車身信號(hào)信息,可以為用戶進(jìn)行車輛故障診斷。
在數(shù)字人領(lǐng)域,數(shù)智分身技術(shù)發(fā)展,推動(dòng)數(shù)字人從定制化走向普惠化。我們通過(guò)行業(yè)大模型,進(jìn)一步降低數(shù)字人應(yīng)用門檻,提升生產(chǎn)效率及交互體驗(yàn)。
今年4月,我們推出了數(shù)智人工廠,24小時(shí)即可生成小樣本數(shù)智人。今天,在AI大模型技術(shù)的加持下,我們?cè)俅翁嵘a(chǎn)效率,發(fā)布“通用口型”版小樣本數(shù)智人,無(wú)需訓(xùn)練,上傳素材后,1小時(shí)內(nèi)即可獲取專屬數(shù)智分身,數(shù)智人生產(chǎn)效率再次獲得提升。雖然流程、時(shí)間都大幅簡(jiǎn)化,但形象效果依然很逼真。
大模型技術(shù)的加持,也讓數(shù)智人實(shí)現(xiàn)更高效、更自然、更智能的效果。我們?nèi)律?jí)的“交互式”小樣本數(shù)智人,可以根據(jù)真實(shí)對(duì)話場(chǎng)景,進(jìn)行手勢(shì)的停頓、變化,更接近于真人交互狀態(tài)。具有交互能力的小樣本數(shù)智人,未來(lái)將不再局限于短視頻生產(chǎn)這類單向播報(bào)場(chǎng)景,也可以被用于服務(wù)咨詢等交互場(chǎng)景。
在3D數(shù)智人生產(chǎn)運(yùn)營(yíng)領(lǐng)域,依托AI大模型技術(shù),我們推動(dòng)照片式生成3D形象,改變手工作業(yè)形式,大幅提升生成速度。也可以實(shí)現(xiàn)智能動(dòng)作驅(qū)動(dòng),基于語(yǔ)義為3D數(shù)智人自動(dòng)匹配動(dòng)作,讓“數(shù)智員工”服務(wù)體驗(yàn)接近于真人員工。
可以看到,AI大模型應(yīng)用,正在催生“效率革命”,讓智能應(yīng)用表現(xiàn)出更強(qiáng)的能力、更高的效率,落地更多場(chǎng)景。未來(lái),我們將持續(xù)將AI大模型等先進(jìn)技術(shù),應(yīng)用于內(nèi)部PaaS、SaaS產(chǎn)品,打通AI產(chǎn)業(yè)落地全鏈條,重塑智能時(shí)代生產(chǎn)力。讓更多開箱即用的AI大模型產(chǎn)品、服務(wù),助力客戶實(shí)現(xiàn)數(shù)智化升級(jí)。
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP