2023-09-07 11:29:15
國產(chǎn)大模型進(jìn)入長跑期,從參數(shù)至上轉(zhuǎn)向?qū)嵱脙?yōu)先。
9月7日,在2023騰訊全球數(shù)字生態(tài)大會上,騰訊混元大模型正式亮相,并宣布通過騰訊云對外開放。
騰訊混元大模型是由騰訊全鏈路自研的通用大語言模型,擁有超千億參數(shù)規(guī)模,預(yù)訓(xùn)練語料超2萬億tokens,具備強(qiáng)大的中文創(chuàng)作能力,復(fù)雜語境下的邏輯推理能力,以及可靠的任務(wù)執(zhí)行能力。
值得關(guān)注的是,騰訊混元大模型是“從實(shí)踐中來,到實(shí)踐中去”的實(shí)用級大模型。騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ瀏覽器等超過50個騰訊業(yè)務(wù)和產(chǎn)品,已經(jīng)接入騰訊混元大模型測試,并取得初步效果。
據(jù)了解,混元大模型將作為騰訊云MaaS服務(wù)的底座,客戶不僅可以直接通過API調(diào)用混元,也可以將混元作為基底模型,為不同產(chǎn)業(yè)場景構(gòu)建專屬應(yīng)用。
騰訊集團(tuán)高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生表示:“以大模型生成技術(shù)為核心,人工智能正在成為下一輪數(shù)字化發(fā)展的關(guān)鍵動力,也為解決產(chǎn)業(yè)痛點(diǎn)帶來了全新的思路。大模型需要基于產(chǎn)業(yè)場景,與企業(yè)數(shù)據(jù)融合,才能釋放出最大的價值。”
據(jù)騰訊集團(tuán)副總裁蔣杰介紹,騰訊混元大模型從第一個token開始從零訓(xùn)練,掌握了從模型算法到機(jī)器學(xué)習(xí)框架,再到AI基礎(chǔ)設(shè)施的全鏈路自研技術(shù)。
騰訊集團(tuán)副總裁 蔣杰
從2021年開始,騰訊先后推出千億和萬億參數(shù)的NLP稀疏大模型,打破CLUE三大榜單紀(jì)錄,實(shí)現(xiàn)在中文理解能力上的新突破。
目前,業(yè)界大模型在場景中的應(yīng)用依然有限,主要集中在容錯率高、任務(wù)簡單的休閑場景。騰訊在算法層面進(jìn)行了一系列自研創(chuàng)新,提高了模型可靠性和成熟度。
針對大模型容易“胡言亂語”的問題,騰訊優(yōu)化了預(yù)訓(xùn)練算法及策略,讓混元大模型的幻覺相比主流開源大模型降低了30%至50%;通過強(qiáng)化學(xué)習(xí)的方法,讓模型學(xué)會識別陷阱問題;通過位置編碼優(yōu)化,提高了超長文的處理效果和性能;提出思維鏈的新策略,讓大模型能夠像人一樣結(jié)合實(shí)際的應(yīng)用場景進(jìn)行推理和決策。
此外,騰訊還自研了機(jī)器學(xué)習(xí)框架Angel,使訓(xùn)練速度相比業(yè)界主流框架提升1倍,推理速度比業(yè)界主流框架提升1.3倍。
騰訊混元大模型 全鏈路自研
得益于全鏈路自研技術(shù),騰訊混元大模型能夠理解上下文的含義,并且有長文記憶能力,可以流暢地進(jìn)行專業(yè)領(lǐng)域的多輪對話。除此之外,它還能進(jìn)行文學(xué)創(chuàng)作、文本摘要、角色扮演等內(nèi)容創(chuàng)作,做到充分理解用戶意圖,并高效、準(zhǔn)確地給出有時效性的答復(fù)。
在中國信通院《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用的評估方法》的標(biāo)準(zhǔn)符合性測試中,混元大模型共測評66個能力項(xiàng),在“模型開發(fā)”和“模型能力”兩個重要領(lǐng)域的綜合評價均獲得了當(dāng)前的最高分。在主流的評測集MMLU、CEval和AGI-eval上,混元大模型均有優(yōu)異的表現(xiàn),特別是在中文的理科、高考題和數(shù)學(xué)等子項(xiàng)上表現(xiàn)突出。
上海財(cái)經(jīng)大學(xué)校長劉元春認(rèn)為:“借助于全鏈路自研,中國將不斷積累大模型相關(guān)人才和技術(shù),逐漸形成體系化的產(chǎn)業(yè)鏈、人才鏈、技術(shù)鏈和創(chuàng)新鏈,最終走出一條發(fā)展通用人工智能的中國路徑,助力我們在數(shù)字技術(shù)的創(chuàng)新上取得突破性進(jìn)展。”
蔣杰表示:“我們研發(fā)大模型的目標(biāo)不是在評測上獲得高分,而是將技術(shù)應(yīng)用到實(shí)際場景中。騰訊將全面擁抱大模型。”
在此次大會上,蔣杰展示了騰訊會議、騰訊文檔、騰訊廣告等多個業(yè)務(wù),在接入騰訊混元大模型后的實(shí)際應(yīng)用情況。
比如騰訊會議基于混元大模型打造了AI小助手,只需要簡單的自然語言指令,就能完成會議信息提取、內(nèi)容分析等復(fù)雜任務(wù),會后還能生成智能總結(jié)紀(jì)要。據(jù)實(shí)測,在指令理解、會中問答、會議摘要、會議待辦項(xiàng)等多個方面,混元大模型均獲得較高的用戶采納率。
騰訊混元大模型在騰訊會議中的應(yīng)用
在文檔處理方面,騰訊混元大模型支持?jǐn)?shù)十種文本創(chuàng)作場景,在騰訊文檔推出的智能助手功能中已有應(yīng)用。同時,混元還能夠一鍵生成標(biāo)準(zhǔn)格式文本,精通數(shù)百種Excel公式,支持自然語言生成函數(shù),并基于表格內(nèi)容生成圖表,目前這些功能正在內(nèi)測階段,將在成熟后面向用戶開放。
在廣告業(yè)務(wù)場景,騰訊混元大模型支持智能化的廣告素材創(chuàng)作,能夠適應(yīng)行業(yè)與地域特色,滿足千人千面的需求,實(shí)現(xiàn)文字、圖片、視頻的自然融合。此外,基于混元大模型的能力,廣告智能導(dǎo)購能夠幫助商家在企業(yè)微信等場景,提升服務(wù)質(zhì)量和服務(wù)效率。
騰訊混元大模型在騰訊廣告中的應(yīng)用
據(jù)了解,今年6月,騰訊云推出了模型即服務(wù)(MaaS)解決方案,提供涵蓋模型預(yù)訓(xùn)練、模型精調(diào)、智能應(yīng)用開發(fā)等一站式的行業(yè)大模型服務(wù)。
最近,騰訊云也全面接入Llama 2、Bloom等20多個主流模型,和混元一樣,都支持直接部署調(diào)用??蛻艨梢愿鶕?jù)實(shí)際需求,基于混元,也可以基于開源模型,打造自己專屬的行業(yè)大模型。
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP