每日經(jīng)濟(jì)新聞 2023-03-15 15:17:10
◎2022年來(lái),越來(lái)越多的數(shù)字人走入千行百業(yè)、投入實(shí)際應(yīng)用,大規(guī)模商業(yè)化就在眼前,行業(yè)同樣在思考,數(shù)字人行業(yè)還有何難點(diǎn)、如何解決、未來(lái)數(shù)字人又將向何處去。
每經(jīng)記者 可楊 每經(jīng)編輯 陳俊杰
元宇宙概念里的數(shù)字人正在走入“真實(shí)世界”。
百度AI數(shù)字人希加加成為數(shù)字人嘉賓,商湯的虛擬員工“小寧”線上線下全方位賦能傳統(tǒng)銀行,小冰打造的虛擬歌手陳水若登上了廣東衛(wèi)視春節(jié)晚會(huì),每日經(jīng)濟(jì)新聞的虛擬主播24小時(shí)播送新聞……在越來(lái)越多的行業(yè)里,人們正在習(xí)慣數(shù)字人的存在。
2022年來(lái),越來(lái)越多的數(shù)字人走入千行百業(yè)、投入實(shí)際應(yīng)用,大規(guī)模商業(yè)化就在眼前,行業(yè)同樣在思考,數(shù)字人行業(yè)還有何難點(diǎn)、如何解決、未來(lái)數(shù)字人又將向何處去。
百度AI數(shù)字人希加加/受訪者供圖
在2月末召開(kāi)的2023全球人工智能開(kāi)發(fā)者先鋒大會(huì)(GAIDC)上,作為大會(huì)邀請(qǐng)的數(shù)字人嘉賓,百度AI數(shù)字人希加加以AIGC首席架構(gòu)師身份發(fā)表演講,為人類嘉賓朋友們講解百度文心大模型在AIGC領(lǐng)域的運(yùn)用,分享她的“心路歷程”。
這是百度數(shù)字人在各行各業(yè)應(yīng)用的縮影。
百度智能云AI應(yīng)用產(chǎn)品部總經(jīng)理劉倩介紹,過(guò)去一年,百度與各行業(yè)的客戶攜手打造了多個(gè)數(shù)字人,例如在廣電及媒體領(lǐng)域,冬奧期間,與央視新聞合作了AI手語(yǔ)主播,為聽(tīng)障人士提供了有溫度的賽事觀看體驗(yàn)。央視網(wǎng)數(shù)字主播小C,連續(xù)兩年兩會(huì)期間采訪對(duì)話人大代表。在虛擬偶像領(lǐng)域,百度推出了像百度品牌代言人希加加這樣純誕生自虛擬世界的IP。
另外還包括數(shù)字人健身教練、數(shù)字人導(dǎo)游、數(shù)字人導(dǎo)購(gòu)、數(shù)字人辦稅官等等,百度智能云打造的多個(gè)數(shù)字人,已經(jīng)廣泛應(yīng)用在金融、運(yùn)營(yíng)商、政務(wù)、文旅、廣電、互娛、航天等領(lǐng)域。
此外,2021年底,百度推出百度智能云曦靈平臺(tái),集數(shù)字人生產(chǎn)、內(nèi)容創(chuàng)作、業(yè)務(wù)配置服務(wù)為一體,來(lái)實(shí)現(xiàn)數(shù)字人的高效生產(chǎn)、智能驅(qū)動(dòng)和低成本運(yùn)營(yíng)。劉倩介紹,過(guò)去一年,曦靈平臺(tái)的產(chǎn)品不斷豐富和迭代,分別發(fā)布了AI手語(yǔ)平臺(tái)、數(shù)字明星運(yùn)營(yíng)平臺(tái)、數(shù)字員工平臺(tái)、數(shù)字人直播平臺(tái)等。以AI手語(yǔ)平臺(tái)為例,可以直接實(shí)現(xiàn)文本轉(zhuǎn)手語(yǔ)、視頻轉(zhuǎn)手語(yǔ)、語(yǔ)音轉(zhuǎn)手語(yǔ),甚至是節(jié)目直播只要接入手語(yǔ)平臺(tái),即可在畫(huà)面上實(shí)時(shí)生成數(shù)字人手語(yǔ)播報(bào)。
在劉倩看來(lái),數(shù)字人不管發(fā)展到什么階段,一定是為了更好地服務(wù)人類和創(chuàng)造更大的價(jià)值,2022年,數(shù)字人正在從概念進(jìn)入實(shí)用階段,形態(tài)和應(yīng)用場(chǎng)景也將不斷豐富。“作為從業(yè)者,我們認(rèn)為數(shù)字人發(fā)展的目標(biāo),其一是在于把人從枯燥、重復(fù)性的工作中解放出來(lái),便于人們做更具創(chuàng)造力的創(chuàng)意工作;其二是在于陪伴和寄托,在數(shù)字世界或元宇宙,讓人類有一個(gè)更好的伙伴或自己。”
劉倩認(rèn)為,想要提供服務(wù),或者是提供陪伴與寄托,就需要數(shù)字人不僅僅停留在有人的外觀、行為上,更要具備人的思想,并且能實(shí)現(xiàn)高頻的互動(dòng)以及內(nèi)容輸出。“目前我們看到行業(yè)中,還有很多數(shù)字人的成本、制作周期非常高,比方說(shuō)給數(shù)字人換一套服裝的成本是幾千到幾萬(wàn)元不等,時(shí)間上也有幾個(gè)星期甚至一個(gè)月。這給了我們一個(gè)很大的啟示,一個(gè)技術(shù)想要真正廣泛應(yīng)用到各行各業(yè),降低其門檻和普惠化是必經(jīng)之路。”
劉倩介紹,從數(shù)字人市場(chǎng)規(guī)模來(lái)看,雖然各個(gè)機(jī)構(gòu)預(yù)測(cè)維度不同,但都呈現(xiàn)出中國(guó)數(shù)字人市場(chǎng)蓬勃發(fā)展的趨勢(shì)。例如有智庫(kù)(量子位智庫(kù)發(fā)布的《虛擬數(shù)字人深度產(chǎn)業(yè)報(bào)告》)預(yù)測(cè),2030年,中國(guó)虛擬數(shù)字人整體市場(chǎng)規(guī)模將高達(dá)2700億。IDC預(yù)測(cè),到2026年,企業(yè)級(jí)市場(chǎng)數(shù)字人相關(guān)的市場(chǎng)規(guī)模將達(dá)102.4億。同時(shí),因?yàn)閿?shù)字人自帶科技感與話題熱度,在2022年形成了多個(gè)營(yíng)銷熱點(diǎn)。數(shù)字人已經(jīng)應(yīng)用在偶像IP、品牌代言人、直播帶貨、主持播報(bào)、企業(yè)服務(wù)等場(chǎng)景,可見(jiàn)數(shù)字人的商業(yè)價(jià)值正在被驗(yàn)證。
“數(shù)字人到底聰不聰明,取決于交互。”劉倩進(jìn)一步介紹,百度即將在3月推出基于百度智能云技術(shù)打造出來(lái)的大模型“文心一言”, 這類生成式AI產(chǎn)品,一方面能提升數(shù)字人自己的經(jīng)驗(yàn)和認(rèn)知,迅速打造不同領(lǐng)域的“專家”,同時(shí)還能開(kāi)創(chuàng)人格化數(shù)字人的創(chuàng)意空間。到那時(shí),人們可能很難判斷,屏幕之后的究竟是數(shù)字人,還是素未謀面的網(wǎng)友,數(shù)字人和現(xiàn)實(shí)人類之間的界限將被模糊。
商湯科技為寧波銀行打造的虛擬數(shù)字員工小寧/受訪者供圖
2022年,商湯科技為寧波銀行專屬打造的虛擬數(shù)字員工“小寧”上線,基于商湯原創(chuàng)的“虛擬IP解決方案”及多種領(lǐng)先的AI技術(shù),可以實(shí)現(xiàn)高效率、低成本的AIGC內(nèi)容創(chuàng)作,助力銀行實(shí)現(xiàn)前端業(yè)務(wù)的用戶積累和營(yíng)銷轉(zhuǎn)化。
“小寧”也是商湯科技AI數(shù)字人“虛擬IP”在“線上”營(yíng)銷場(chǎng)景中的首次應(yīng)用,據(jù)介紹,商湯數(shù)字人“虛擬IP”可以自主直播運(yùn)營(yíng),從粉絲互動(dòng)到直播帶貨,用更低的運(yùn)營(yíng)成本為企業(yè)前端業(yè)務(wù)帶來(lái)全天候的“用戶觸達(dá)”,不斷增強(qiáng)品牌粘性,為品牌帶來(lái)持續(xù)增值。
商湯科技數(shù)字文娛事業(yè)部總經(jīng)理欒青在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)談到,商湯科技在數(shù)字人應(yīng)用的探索,主要期待解決兩個(gè)場(chǎng)景,一方面是各種各樣以人為核心的視頻的快速生成,另外一方面是以人為核心的人機(jī)交互能力的提升,包括多模態(tài)的人機(jī)交互、自然語(yǔ)言處理等方面。以寧波銀行的虛擬人為例,在欒青看來(lái),線下能夠幫助日常的銀行客戶回答問(wèn)題;線上能夠快速的制作各種營(yíng)銷視頻內(nèi)容,幫助企業(yè)更好地宣傳,這是數(shù)字人能夠最終帶來(lái)的核心價(jià)值。
欒青覺(jué)得,商湯對(duì)于數(shù)字人的探索,更多看重?cái)?shù)字人是否能夠進(jìn)入具體的場(chǎng)景落地,比如銀行、短視頻等,“真正走到大家日常生活中,幫助中小企業(yè)更好地與客戶交流,提升日常運(yùn)營(yíng)效率,降低運(yùn)營(yíng)門檻和成本,這是我們認(rèn)為最好的數(shù)字人。”
在欒青看來(lái),在數(shù)字世界,無(wú)論是生活還是工作,虛擬人都是最大的主體,從這個(gè)主體出發(fā),必然有提高其使用效率、讓其更好地服務(wù)大眾的方法。“至少慢慢的每一個(gè)企業(yè)都需要一個(gè)數(shù)字人,直到最終,每個(gè)人在工作和生活中也可能需要一個(gè)數(shù)字人,這其實(shí)是一個(gè)非常大的市場(chǎng)前景。”
而商湯的目標(biāo)則是希望能夠讓更多中小企業(yè)使用數(shù)字人,在欒青看來(lái),這意味著科技能夠普惠大眾,科技能夠有更高的運(yùn)營(yíng)效率,更低的運(yùn)營(yíng)成本。
談及商談科技2022年在數(shù)字人層面的探索,欒青表示,首先從技術(shù)實(shí)力與綜合能力層面,商湯數(shù)字人確實(shí)獲得了行業(yè)認(rèn)可。但同時(shí)她也提到,2022年,整個(gè)行業(yè)對(duì)于“數(shù)字人究竟應(yīng)該如何用”的探索,仍舊處于一個(gè)非常表面的階段。
她進(jìn)一步表示,目前,大家看到數(shù)字人更多想到的是如何去做品牌的營(yíng)銷、如何用數(shù)字人制作宣傳視頻,“我認(rèn)為這是大家開(kāi)始認(rèn)知數(shù)字人第一個(gè)想到的應(yīng)用,但是我并不認(rèn)為這是真正數(shù)字人(應(yīng)用場(chǎng)景)。”僅僅把數(shù)字人的應(yīng)用停留在宣傳片層面,欒青認(rèn)為,這是對(duì)數(shù)字人的技術(shù)的巨大浪費(fèi)。
在她看來(lái),數(shù)字人最終是真正的生產(chǎn)力,“因?yàn)槿吮旧砭褪巧a(chǎn)力,如果我們?cè)谌魏我粋€(gè)場(chǎng)景下替代了人,它就是一個(gè)明確的生產(chǎn)力。”欒青認(rèn)為,如今數(shù)字人行業(yè)已經(jīng)走入一個(gè)更冷靜、更務(wù)實(shí)的階段,未來(lái),行業(yè)也會(huì)從生產(chǎn)力的角度上,去思考和使數(shù)字人,把數(shù)字人變成一個(gè)普遍的方向。
小冰公司打造的虛擬歌手陳水若/受訪者供圖
2023年開(kāi)年,廣東衛(wèi)視春節(jié)晚會(huì)上有了虛擬歌手的身影,小冰打造的虛擬歌手陳水若,與鐘鎮(zhèn)濤、炎明熹等共同演繹了粵語(yǔ)賀年曲《財(cái)神到》。
陳水若基于小冰的神經(jīng)網(wǎng)絡(luò)渲染技術(shù)(XNR)生成,這種技術(shù)能生成一張此前完全不存在的臉(即AI創(chuàng)造面容),并根據(jù)表達(dá)內(nèi)容的不同,渲染出不同的表情和動(dòng)作。整體效果流暢、自然,與真實(shí)人類無(wú)異。
小冰公司首席執(zhí)行官李笛在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示,過(guò)去一年,在抖音平臺(tái),小冰AI歌手的視頻播放量達(dá)到5億次,收到了1677.5萬(wàn)次的交互,回應(yīng)了726.3萬(wàn)次的交互,交互量超過(guò)抖音99%的賬號(hào),“人工智能的高并發(fā)在這里得到了充分的體現(xiàn)。”
回顧去年,李笛表示,2022年,公司在虛擬人布局方面進(jìn)一步拓展到了高度多樣性的虛擬人,他們中絕大部分已經(jīng)不再叫“小冰”,每個(gè)月,這些虛擬人服務(wù)的用戶超過(guò)了1.6億人次,“應(yīng)該說(shuō)我們正在不斷的實(shí)踐AI Being普及化的進(jìn)程。”
李笛進(jìn)一步介紹,除了在以往的 companion(伴侶)、assistant(助理)之外,小冰進(jìn)一步拓展了更多面向企業(yè)的數(shù)字員工,以及在游戲中的AI Being的實(shí)際落地。2022年,小冰公司宣布成立ICEGamer游戲工作室并推動(dòng)NPC向有情感的人工智能交互主體方向發(fā)展,由AI being擔(dān)綱全部NPC。
而在整個(gè)行業(yè)的技術(shù)突破層面,李笛認(rèn)為,2022年在人工智能或者說(shuō)AI Being的幾個(gè)核心技術(shù)棧上,整個(gè)行業(yè)取得了一些天花板級(jí)的突破。比如,大語(yǔ)言模型帶來(lái)的對(duì)話能力的提升,以ChatGPT為代表;多模態(tài)的大模型帶來(lái)的AIGC的提升;神經(jīng)網(wǎng)絡(luò)渲染帶來(lái)的視覺(jué)方面的提升;一系列的超級(jí)自然語(yǔ)音技術(shù)帶來(lái)的語(yǔ)音、情感融合在一起的這種交互能力的提升。“整個(gè)產(chǎn)業(yè)以前受限的技術(shù)瓶頸被打破了,所以它必然會(huì)迎來(lái)一個(gè)更快的創(chuàng)新發(fā)展。”
與此同時(shí),小冰也面臨著在人工智能方面的最主要難點(diǎn),即技術(shù)創(chuàng)新和倫理以及社會(huì)接受度之間的距離。人工智能最重要的一個(gè)特點(diǎn)是高并發(fā),所以有一點(diǎn)點(diǎn)錯(cuò)誤,都會(huì)被無(wú)限放大。李笛進(jìn)一步舉例稱,一個(gè)能夠?qū)懽骰蛱峁┲R(shí)的人工智能系統(tǒng),假設(shè)它的錯(cuò)誤率是10%,假設(shè)每天有1億次交互,那就意味著每天會(huì)創(chuàng)作超過(guò)一千萬(wàn)篇虛假新聞。人工智能的高并發(fā)會(huì)把錯(cuò)誤率變得非??植馈?ldquo;這方面一直是我們所面臨的難點(diǎn),就是說(shuō)我們需要不停的反復(fù)審視我們手上的技術(shù),設(shè)想這些技術(shù)落地時(shí)可能發(fā)生的挑戰(zhàn),以及我們自己怎樣解決這些問(wèn)題。”
談及未來(lái),李笛認(rèn)為,人類社會(huì)在AI技術(shù)的推動(dòng)下,必然會(huì)走向人人被AI Being環(huán)繞的那一天。“不只是每個(gè)人有一個(gè)虛擬人,而是每個(gè)人會(huì)和很多個(gè)虛擬人建立連接,每個(gè)虛擬人也可能會(huì)和很多個(gè)人建立連接,這將是一種全新的社交關(guān)系網(wǎng)。”
他進(jìn)一步表示,虛擬人不存在從b端轉(zhuǎn)向c端。“在我們的認(rèn)識(shí)中,凡是需要AI Being這種帶有一定擬人特點(diǎn)的人工智能系統(tǒng),都意味著它必然是在跟人做交互,只要是跟人做交互,就需要有擬人特點(diǎn)。所以即便是給b端提供的AI Being,也非常鮮明的具有c端特點(diǎn)。”
基于此,李笛認(rèn)為,對(duì)于人工智能AI Being來(lái)講,所有的to b問(wèn)題,歸根結(jié)底都是to c問(wèn)題,從b端轉(zhuǎn)向c端,實(shí)際上早已發(fā)生。
雨燕智宣智慧微課系統(tǒng)/受訪者供圖
沒(méi)有特別打扮,通過(guò)手機(jī)錄了一段30秒的視頻,等待了半小時(shí)后,周宇翔看到了自己的虛擬人形象,那是每經(jīng)科技團(tuán)隊(duì)首次成功自主做出虛擬人。“我真人在電腦面前,然后看著電腦里邊的自己,那一刻其實(shí)也是非常激動(dòng)非常驚喜。”周宇翔說(shuō)。
由這次的突破展開(kāi),2022年12月9日,每日經(jīng)濟(jì)新聞?wù)酵瞥隽擞勺庸久拷?jīng)新視界科技有限公司(以下簡(jiǎn)稱每經(jīng)科技)自主研發(fā)的視頻生產(chǎn)全流程AI智能解決方案——“雨燕智宣”。
每經(jīng)科技自主研發(fā)數(shù)字人技術(shù),融合了語(yǔ)音識(shí)別、語(yǔ)音合成、圖像識(shí)別、自然語(yǔ)言處理、語(yǔ)音驅(qū)動(dòng)數(shù)字人等AI核心技術(shù),支持根據(jù)真人形象進(jìn)行定制和訓(xùn)練,對(duì)人物的骨骼、衣服、表情、身體動(dòng)作等進(jìn)行具體設(shè)計(jì),以達(dá)到真實(shí)、自然、形象、生動(dòng)的效果,通過(guò)錄入的文本、語(yǔ)音驅(qū)動(dòng)數(shù)字人的播報(bào),數(shù)字人的唇形、動(dòng)作、表情等通過(guò)模型計(jì)算渲染生產(chǎn)基于真人視頻進(jìn)行學(xué)習(xí)和訓(xùn)練,成品數(shù)字人還原度高,有效降低維和感。
每經(jīng)科技產(chǎn)品經(jīng)理周宇翔表示,2022年對(duì)每經(jīng)科技而言是一個(gè)技術(shù)大年。2021年每日經(jīng)濟(jì)新聞與小冰公司合作,上線了每經(jīng)AI電視,依托N小黑、N小白兩位虛擬主播,進(jìn)行24小時(shí)新聞播報(bào)。以此為契機(jī),每經(jīng)科技開(kāi)始了對(duì)自研虛擬人的摸索,并在2022年成功掌握了虛擬人自主建模和訓(xùn)練的能力。
2022年在虛擬人領(lǐng)域的技術(shù)突破以及與自身媒體業(yè)務(wù)相匹配的應(yīng)用場(chǎng)景,是周宇翔認(rèn)為每經(jīng)科技在2022年最大的成果之一。
周宇翔認(rèn)為,探索虛擬人,不僅是在媒體的業(yè)務(wù)場(chǎng)景中植入一個(gè)虛擬人形象,還能夠通過(guò)對(duì)虛擬人以及AI技術(shù)為代表的新興技術(shù)的探索,為媒體轉(zhuǎn)型提供技術(shù)思路和技術(shù)空間。他舉了個(gè)例子,受限于電視端等硬件條件,以往,紙媒要做類似于電視類的傳播媒介,是不可想象的,“每經(jīng)在轉(zhuǎn)型的過(guò)程中,其中一項(xiàng)重點(diǎn)是盡可能將各類傳播媒介進(jìn)行融合應(yīng)用,來(lái)達(dá)到傳播效果的最佳程度,而虛擬人技術(shù)的誕生以及其在虛擬主播等領(lǐng)域的延伸應(yīng)用,為包括紙媒在內(nèi)的非電視端媒介提供了一個(gè)非常好的融合的機(jī)會(huì)。”
目前,每經(jīng)科技推出的雨燕智宣平臺(tái)已經(jīng)形成了自己的系列成品矩陣,其虛擬人除了未來(lái)可應(yīng)用于每經(jīng)AI電視以外,還可通過(guò)AI短視頻生成平臺(tái)、智慧微課平臺(tái)等系統(tǒng)應(yīng)用到資訊短視頻、投教類長(zhǎng)視頻、品宣推廣視頻等制作環(huán)節(jié)中,利用新興技術(shù)的高效來(lái)大幅減輕甚至替代以往人工需要反復(fù)介入的工作。“虛擬人的技術(shù)本身只是一個(gè)單純的技術(shù),而和各行各業(yè)應(yīng)用場(chǎng)景結(jié)合,創(chuàng)造出更多價(jià)值,是虛擬人技術(shù)衍生出來(lái)后最大的意義所在。”
周宇翔表示,未來(lái)每經(jīng)科技也將繼續(xù)探索與更多實(shí)際業(yè)務(wù)、應(yīng)用場(chǎng)景相結(jié)合,“當(dāng)前虛擬人技術(shù)的價(jià)值核心表面上看是含‘科’量的提升,但歸根結(jié)底依舊在于解放人力資源,提高生產(chǎn)力。如果不能挖掘或者融入實(shí)際的應(yīng)用場(chǎng)景,其實(shí)對(duì)于市場(chǎng)來(lái)說(shuō)沒(méi)有任何價(jià)值。怎么樣讓虛擬人從好看向好用轉(zhuǎn)化,這是我們做切入的重點(diǎn)方向。”
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP