2023-09-08 12:07:17
AI大模型推動(dòng)人機(jī)交互模式發(fā)生革命性變化,讓更高效、更逼真、更智能的數(shù)智人應(yīng)用成為可能。在9月7日舉辦的2023騰訊全球數(shù)字生態(tài)大會(huì)上,騰訊云智能數(shù)智人產(chǎn)品公布三大升級(jí),依托行業(yè)大模型技術(shù),實(shí)現(xiàn)數(shù)智人生產(chǎn)效率及交互體驗(yàn)提升,降低數(shù)字人應(yīng)用門檻,加速推動(dòng)AI數(shù)字人普惠。
其中,全新發(fā)布“通用口型版”小樣本數(shù)智人,只需要1分鐘真人口播視頻,平臺(tái)便可通過多模態(tài)數(shù)據(jù)輸入,無需訓(xùn)練生成個(gè)性化口型,在1小時(shí)內(nèi)制作出與真人近似的“數(shù)智人”。
騰訊云智能數(shù)智人創(chuàng)意展臺(tái)
今年4月,騰訊云智能小樣本數(shù)智人生產(chǎn)平臺(tái)首次對(duì)外發(fā)布,平臺(tái)具有訓(xùn)練樣本小、生產(chǎn)效率高、自動(dòng)化生產(chǎn)等特性,可以輕松實(shí)現(xiàn)“自助式”數(shù)智人生產(chǎn)制作。依托行業(yè)大模型,騰訊云智能數(shù)智人工廠全新升級(jí),覆蓋三大方向:生成效率更高、應(yīng)用場景更廣、3D數(shù)智人生產(chǎn)運(yùn)營更智能。
在生成效率上,全新發(fā)布的“通用口型”版小樣本數(shù)智人,生產(chǎn)時(shí)間、生產(chǎn)素材需求都進(jìn)一步降低。在AI大模型技術(shù)的加持下,基于自監(jiān)督機(jī)制的通用多模態(tài)模型,通過擴(kuò)充人像特征提取及口型關(guān)系綁定,無需訓(xùn)練即可生成每個(gè)人的個(gè)性化口型特征。這推動(dòng)2D小樣本數(shù)字人生產(chǎn)時(shí)長可從24小時(shí)縮短至1小時(shí),生產(chǎn)素材簡化至只需要1分鐘真人口播視頻。
在應(yīng)用場景上,全新升級(jí)的“交互式”小樣本數(shù)智人,支持“傾聽等待狀態(tài)”識(shí)別,能夠根據(jù)真實(shí)對(duì)話場景進(jìn)行手勢(shì)的停頓、變化。這將使得“交互式”小樣本數(shù)智人不再局限于短視頻生產(chǎn)等單向播報(bào)場景,也可以廣泛用于服務(wù)咨詢等交互場景。
在生產(chǎn)運(yùn)營上,依托AI建模綁定算法,騰訊云智能實(shí)現(xiàn)照片式生成3D形象,改變手工作業(yè)形式,大幅提升3D形象生成速度,支持批量打造3D數(shù)智人;同時(shí),全面升級(jí)“智能驅(qū)動(dòng)”3D數(shù)智人,可以基于語義為3D數(shù)智人自動(dòng)匹配動(dòng)作,讓3D“數(shù)智員工”服務(wù)體驗(yàn)接近于真人員工。例如,圍繞大模型客服,數(shù)智人可以依據(jù)大模型實(shí)時(shí)生成的答案,匹配相應(yīng)的表情、動(dòng)作,實(shí)現(xiàn)更自然的交互。
目前,騰訊云智能數(shù)智人被廣泛應(yīng)用于口播視頻生產(chǎn)、直播帶貨等場景。以媒體領(lǐng)域?yàn)槔?,小樣本?shù)智人等技術(shù)正在為媒體數(shù)字化轉(zhuǎn)型升級(jí)注入更多AI力量,包括南方日?qǐng)?bào)、南方都市報(bào)等機(jī)構(gòu)用數(shù)智人輔助采編團(tuán)隊(duì)生成口播視頻,進(jìn)一步提升內(nèi)容生產(chǎn)效率。
此前,騰訊云智能提出自動(dòng)化“AI+數(shù)智人工廠”的方向,通過做厚aPaaS數(shù)智人平臺(tái),致力于讓合作伙伴能夠應(yīng)用開箱即用的數(shù)智人生產(chǎn)服務(wù),快速完成大批量數(shù)智人形象、音色定制,開發(fā)出更多適用于垂直行業(yè)、垂直場景的數(shù)智人SaaS服務(wù)。目前,已經(jīng)有數(shù)十家合作伙伴依托平臺(tái),向行業(yè)提供數(shù)智人直播SaaS、知識(shí)口播SaaS應(yīng)用,覆蓋醫(yī)療、傳媒、金融多個(gè)行業(yè)。
為了推動(dòng)數(shù)智人服務(wù)更廣泛落地,以“普惠化”服務(wù)走入千行百業(yè),騰訊發(fā)布了“數(shù)智人伙伴扶持計(jì)劃”,為直播運(yùn)營、營銷代理、MCN等領(lǐng)域伙伴提供數(shù)字人技術(shù)支持。
首批騰訊云智能數(shù)智人授權(quán)合作伙伴包括北京風(fēng)平智能科技有限公司、中數(shù)聯(lián)成(廣東)文化有限公司、深圳市單仁牛商科技有限公司,以及陜西醫(yī)智諾信息科技有限公司。
首批騰訊云智能數(shù)智人授權(quán)合作伙伴
騰訊云副總裁、騰訊云智能解決方案負(fù)責(zé)人王麒表示,參與“數(shù)智人扶持計(jì)劃”的企業(yè),不僅能夠獲得騰訊云官方授權(quán)證書及官網(wǎng)展示,還會(huì)獲得市場拓展專項(xiàng)資金、標(biāo)桿案例聯(lián)合發(fā)聲等系列支持。
目前,騰訊云智能數(shù)智人已經(jīng)覆蓋3D寫實(shí)、3D半寫實(shí)、3D卡通、2D真人、2D卡通五種形象風(fēng)格,可實(shí)現(xiàn)超細(xì)微面部情感表情以及數(shù)百種肢體動(dòng)作,支持形象資產(chǎn)管理、業(yè)務(wù)服務(wù)配置及內(nèi)容生產(chǎn)相關(guān)服務(wù),以滿足不同場景下的服務(wù)需求。
在數(shù)智人之外,AI大模型的應(yīng)用正逐步滲透到千行百業(yè)的各個(gè)環(huán)節(jié),包括設(shè)計(jì)、研發(fā)、生產(chǎn)、營銷和服務(wù)等,一場由“大模型”驅(qū)動(dòng)的“效能革命”正在悄然發(fā)生?;诖?,騰訊云從產(chǎn)業(yè)客戶實(shí)際需求出發(fā),基于自研的騰訊混元大模型,同時(shí)支持業(yè)內(nèi)主流的開源模型應(yīng)用,從技術(shù)底座、平臺(tái)能力和智能應(yīng)用三個(gè)維度不斷升級(jí)MaaS能力,助力客戶構(gòu)建專屬大模型和智能應(yīng)用,推動(dòng)大模型在產(chǎn)業(yè)中的落地應(yīng)用。未來,騰訊云還將推出更多開箱即用的大模型產(chǎn)品、服務(wù),推動(dòng)大模型等AI技術(shù)在實(shí)際生產(chǎn)、運(yùn)營場景發(fā)揮效用。
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP