每日經(jīng)濟新聞 2023-03-15 15:17:10
◎2022年來,越來越多的數(shù)字人走入千行百業(yè)、投入實際應(yīng)用,大規(guī)模商業(yè)化就在眼前,行業(yè)同樣在思考,數(shù)字人行業(yè)還有何難點、如何解決、未來數(shù)字人又將向何處去。
每經(jīng)記者 可楊 每經(jīng)編輯 陳俊杰
元宇宙概念里的數(shù)字人正在走入“真實世界”。
百度AI數(shù)字人希加加成為數(shù)字人嘉賓,商湯的虛擬員工“小寧”線上線下全方位賦能傳統(tǒng)銀行,小冰打造的虛擬歌手陳水若登上了廣東衛(wèi)視春節(jié)晚會,每日經(jīng)濟新聞的虛擬主播24小時播送新聞……在越來越多的行業(yè)里,人們正在習(xí)慣數(shù)字人的存在。
2022年來,越來越多的數(shù)字人走入千行百業(yè)、投入實際應(yīng)用,大規(guī)模商業(yè)化就在眼前,行業(yè)同樣在思考,數(shù)字人行業(yè)還有何難點、如何解決、未來數(shù)字人又將向何處去。
百度AI數(shù)字人希加加/受訪者供圖
在2月末召開的2023全球人工智能開發(fā)者先鋒大會(GAIDC)上,作為大會邀請的數(shù)字人嘉賓,百度AI數(shù)字人希加加以AIGC首席架構(gòu)師身份發(fā)表演講,為人類嘉賓朋友們講解百度文心大模型在AIGC領(lǐng)域的運用,分享她的“心路歷程”。
這是百度數(shù)字人在各行各業(yè)應(yīng)用的縮影。
百度智能云AI應(yīng)用產(chǎn)品部總經(jīng)理劉倩介紹,過去一年,百度與各行業(yè)的客戶攜手打造了多個數(shù)字人,例如在廣電及媒體領(lǐng)域,冬奧期間,與央視新聞合作了AI手語主播,為聽障人士提供了有溫度的賽事觀看體驗。央視網(wǎng)數(shù)字主播小C,連續(xù)兩年兩會期間采訪對話人大代表。在虛擬偶像領(lǐng)域,百度推出了像百度品牌代言人希加加這樣純誕生自虛擬世界的IP。
另外還包括數(shù)字人健身教練、數(shù)字人導(dǎo)游、數(shù)字人導(dǎo)購、數(shù)字人辦稅官等等,百度智能云打造的多個數(shù)字人,已經(jīng)廣泛應(yīng)用在金融、運營商、政務(wù)、文旅、廣電、互娛、航天等領(lǐng)域。
此外,2021年底,百度推出百度智能云曦靈平臺,集數(shù)字人生產(chǎn)、內(nèi)容創(chuàng)作、業(yè)務(wù)配置服務(wù)為一體,來實現(xiàn)數(shù)字人的高效生產(chǎn)、智能驅(qū)動和低成本運營。劉倩介紹,過去一年,曦靈平臺的產(chǎn)品不斷豐富和迭代,分別發(fā)布了AI手語平臺、數(shù)字明星運營平臺、數(shù)字員工平臺、數(shù)字人直播平臺等。以AI手語平臺為例,可以直接實現(xiàn)文本轉(zhuǎn)手語、視頻轉(zhuǎn)手語、語音轉(zhuǎn)手語,甚至是節(jié)目直播只要接入手語平臺,即可在畫面上實時生成數(shù)字人手語播報。
在劉倩看來,數(shù)字人不管發(fā)展到什么階段,一定是為了更好地服務(wù)人類和創(chuàng)造更大的價值,2022年,數(shù)字人正在從概念進入實用階段,形態(tài)和應(yīng)用場景也將不斷豐富。“作為從業(yè)者,我們認(rèn)為數(shù)字人發(fā)展的目標(biāo),其一是在于把人從枯燥、重復(fù)性的工作中解放出來,便于人們做更具創(chuàng)造力的創(chuàng)意工作;其二是在于陪伴和寄托,在數(shù)字世界或元宇宙,讓人類有一個更好的伙伴或自己。”
劉倩認(rèn)為,想要提供服務(wù),或者是提供陪伴與寄托,就需要數(shù)字人不僅僅停留在有人的外觀、行為上,更要具備人的思想,并且能實現(xiàn)高頻的互動以及內(nèi)容輸出。“目前我們看到行業(yè)中,還有很多數(shù)字人的成本、制作周期非常高,比方說給數(shù)字人換一套服裝的成本是幾千到幾萬元不等,時間上也有幾個星期甚至一個月。這給了我們一個很大的啟示,一個技術(shù)想要真正廣泛應(yīng)用到各行各業(yè),降低其門檻和普惠化是必經(jīng)之路。”
劉倩介紹,從數(shù)字人市場規(guī)模來看,雖然各個機構(gòu)預(yù)測維度不同,但都呈現(xiàn)出中國數(shù)字人市場蓬勃發(fā)展的趨勢。例如有智庫(量子位智庫發(fā)布的《虛擬數(shù)字人深度產(chǎn)業(yè)報告》)預(yù)測,2030年,中國虛擬數(shù)字人整體市場規(guī)模將高達2700億。IDC預(yù)測,到2026年,企業(yè)級市場數(shù)字人相關(guān)的市場規(guī)模將達102.4億。同時,因為數(shù)字人自帶科技感與話題熱度,在2022年形成了多個營銷熱點。數(shù)字人已經(jīng)應(yīng)用在偶像IP、品牌代言人、直播帶貨、主持播報、企業(yè)服務(wù)等場景,可見數(shù)字人的商業(yè)價值正在被驗證。
“數(shù)字人到底聰不聰明,取決于交互。”劉倩進一步介紹,百度即將在3月推出基于百度智能云技術(shù)打造出來的大模型“文心一言”, 這類生成式AI產(chǎn)品,一方面能提升數(shù)字人自己的經(jīng)驗和認(rèn)知,迅速打造不同領(lǐng)域的“專家”,同時還能開創(chuàng)人格化數(shù)字人的創(chuàng)意空間。到那時,人們可能很難判斷,屏幕之后的究竟是數(shù)字人,還是素未謀面的網(wǎng)友,數(shù)字人和現(xiàn)實人類之間的界限將被模糊。
商湯科技為寧波銀行打造的虛擬數(shù)字員工小寧/受訪者供圖
2022年,商湯科技為寧波銀行專屬打造的虛擬數(shù)字員工“小寧”上線,基于商湯原創(chuàng)的“虛擬IP解決方案”及多種領(lǐng)先的AI技術(shù),可以實現(xiàn)高效率、低成本的AIGC內(nèi)容創(chuàng)作,助力銀行實現(xiàn)前端業(yè)務(wù)的用戶積累和營銷轉(zhuǎn)化。
“小寧”也是商湯科技AI數(shù)字人“虛擬IP”在“線上”營銷場景中的首次應(yīng)用,據(jù)介紹,商湯數(shù)字人“虛擬IP”可以自主直播運營,從粉絲互動到直播帶貨,用更低的運營成本為企業(yè)前端業(yè)務(wù)帶來全天候的“用戶觸達”,不斷增強品牌粘性,為品牌帶來持續(xù)增值。
商湯科技數(shù)字文娛事業(yè)部總經(jīng)理欒青在接受《每日經(jīng)濟新聞》記者采訪時談到,商湯科技在數(shù)字人應(yīng)用的探索,主要期待解決兩個場景,一方面是各種各樣以人為核心的視頻的快速生成,另外一方面是以人為核心的人機交互能力的提升,包括多模態(tài)的人機交互、自然語言處理等方面。以寧波銀行的虛擬人為例,在欒青看來,線下能夠幫助日常的銀行客戶回答問題;線上能夠快速的制作各種營銷視頻內(nèi)容,幫助企業(yè)更好地宣傳,這是數(shù)字人能夠最終帶來的核心價值。
欒青覺得,商湯對于數(shù)字人的探索,更多看重數(shù)字人是否能夠進入具體的場景落地,比如銀行、短視頻等,“真正走到大家日常生活中,幫助中小企業(yè)更好地與客戶交流,提升日常運營效率,降低運營門檻和成本,這是我們認(rèn)為最好的數(shù)字人。”
在欒青看來,在數(shù)字世界,無論是生活還是工作,虛擬人都是最大的主體,從這個主體出發(fā),必然有提高其使用效率、讓其更好地服務(wù)大眾的方法。“至少慢慢的每一個企業(yè)都需要一個數(shù)字人,直到最終,每個人在工作和生活中也可能需要一個數(shù)字人,這其實是一個非常大的市場前景。”
而商湯的目標(biāo)則是希望能夠讓更多中小企業(yè)使用數(shù)字人,在欒青看來,這意味著科技能夠普惠大眾,科技能夠有更高的運營效率,更低的運營成本。
談及商談科技2022年在數(shù)字人層面的探索,欒青表示,首先從技術(shù)實力與綜合能力層面,商湯數(shù)字人確實獲得了行業(yè)認(rèn)可。但同時她也提到,2022年,整個行業(yè)對于“數(shù)字人究竟應(yīng)該如何用”的探索,仍舊處于一個非常表面的階段。
她進一步表示,目前,大家看到數(shù)字人更多想到的是如何去做品牌的營銷、如何用數(shù)字人制作宣傳視頻,“我認(rèn)為這是大家開始認(rèn)知數(shù)字人第一個想到的應(yīng)用,但是我并不認(rèn)為這是真正數(shù)字人(應(yīng)用場景)。”僅僅把數(shù)字人的應(yīng)用停留在宣傳片層面,欒青認(rèn)為,這是對數(shù)字人的技術(shù)的巨大浪費。
在她看來,數(shù)字人最終是真正的生產(chǎn)力,“因為人本身就是生產(chǎn)力,如果我們在任何一個場景下替代了人,它就是一個明確的生產(chǎn)力。”欒青認(rèn)為,如今數(shù)字人行業(yè)已經(jīng)走入一個更冷靜、更務(wù)實的階段,未來,行業(yè)也會從生產(chǎn)力的角度上,去思考和使數(shù)字人,把數(shù)字人變成一個普遍的方向。
小冰公司打造的虛擬歌手陳水若/受訪者供圖
2023年開年,廣東衛(wèi)視春節(jié)晚會上有了虛擬歌手的身影,小冰打造的虛擬歌手陳水若,與鐘鎮(zhèn)濤、炎明熹等共同演繹了粵語賀年曲《財神到》。
陳水若基于小冰的神經(jīng)網(wǎng)絡(luò)渲染技術(shù)(XNR)生成,這種技術(shù)能生成一張此前完全不存在的臉(即AI創(chuàng)造面容),并根據(jù)表達內(nèi)容的不同,渲染出不同的表情和動作。整體效果流暢、自然,與真實人類無異。
小冰公司首席執(zhí)行官李笛在接受《每日經(jīng)濟新聞》記者采訪時表示,過去一年,在抖音平臺,小冰AI歌手的視頻播放量達到5億次,收到了1677.5萬次的交互,回應(yīng)了726.3萬次的交互,交互量超過抖音99%的賬號,“人工智能的高并發(fā)在這里得到了充分的體現(xiàn)。”
回顧去年,李笛表示,2022年,公司在虛擬人布局方面進一步拓展到了高度多樣性的虛擬人,他們中絕大部分已經(jīng)不再叫“小冰”,每個月,這些虛擬人服務(wù)的用戶超過了1.6億人次,“應(yīng)該說我們正在不斷的實踐AI Being普及化的進程。”
李笛進一步介紹,除了在以往的 companion(伴侶)、assistant(助理)之外,小冰進一步拓展了更多面向企業(yè)的數(shù)字員工,以及在游戲中的AI Being的實際落地。2022年,小冰公司宣布成立ICEGamer游戲工作室并推動NPC向有情感的人工智能交互主體方向發(fā)展,由AI being擔(dān)綱全部NPC。
而在整個行業(yè)的技術(shù)突破層面,李笛認(rèn)為,2022年在人工智能或者說AI Being的幾個核心技術(shù)棧上,整個行業(yè)取得了一些天花板級的突破。比如,大語言模型帶來的對話能力的提升,以ChatGPT為代表;多模態(tài)的大模型帶來的AIGC的提升;神經(jīng)網(wǎng)絡(luò)渲染帶來的視覺方面的提升;一系列的超級自然語音技術(shù)帶來的語音、情感融合在一起的這種交互能力的提升。“整個產(chǎn)業(yè)以前受限的技術(shù)瓶頸被打破了,所以它必然會迎來一個更快的創(chuàng)新發(fā)展。”
與此同時,小冰也面臨著在人工智能方面的最主要難點,即技術(shù)創(chuàng)新和倫理以及社會接受度之間的距離。人工智能最重要的一個特點是高并發(fā),所以有一點點錯誤,都會被無限放大。李笛進一步舉例稱,一個能夠?qū)懽骰蛱峁┲R的人工智能系統(tǒng),假設(shè)它的錯誤率是10%,假設(shè)每天有1億次交互,那就意味著每天會創(chuàng)作超過一千萬篇虛假新聞。人工智能的高并發(fā)會把錯誤率變得非常恐怖。“這方面一直是我們所面臨的難點,就是說我們需要不停的反復(fù)審視我們手上的技術(shù),設(shè)想這些技術(shù)落地時可能發(fā)生的挑戰(zhàn),以及我們自己怎樣解決這些問題。”
談及未來,李笛認(rèn)為,人類社會在AI技術(shù)的推動下,必然會走向人人被AI Being環(huán)繞的那一天。“不只是每個人有一個虛擬人,而是每個人會和很多個虛擬人建立連接,每個虛擬人也可能會和很多個人建立連接,這將是一種全新的社交關(guān)系網(wǎng)。”
他進一步表示,虛擬人不存在從b端轉(zhuǎn)向c端。“在我們的認(rèn)識中,凡是需要AI Being這種帶有一定擬人特點的人工智能系統(tǒng),都意味著它必然是在跟人做交互,只要是跟人做交互,就需要有擬人特點。所以即便是給b端提供的AI Being,也非常鮮明的具有c端特點。”
基于此,李笛認(rèn)為,對于人工智能AI Being來講,所有的to b問題,歸根結(jié)底都是to c問題,從b端轉(zhuǎn)向c端,實際上早已發(fā)生。
雨燕智宣智慧微課系統(tǒng)/受訪者供圖
沒有特別打扮,通過手機錄了一段30秒的視頻,等待了半小時后,周宇翔看到了自己的虛擬人形象,那是每經(jīng)科技團隊首次成功自主做出虛擬人。“我真人在電腦面前,然后看著電腦里邊的自己,那一刻其實也是非常激動非常驚喜。”周宇翔說。
由這次的突破展開,2022年12月9日,每日經(jīng)濟新聞?wù)酵瞥隽擞勺庸久拷?jīng)新視界科技有限公司(以下簡稱每經(jīng)科技)自主研發(fā)的視頻生產(chǎn)全流程AI智能解決方案——“雨燕智宣”。
每經(jīng)科技自主研發(fā)數(shù)字人技術(shù),融合了語音識別、語音合成、圖像識別、自然語言處理、語音驅(qū)動數(shù)字人等AI核心技術(shù),支持根據(jù)真人形象進行定制和訓(xùn)練,對人物的骨骼、衣服、表情、身體動作等進行具體設(shè)計,以達到真實、自然、形象、生動的效果,通過錄入的文本、語音驅(qū)動數(shù)字人的播報,數(shù)字人的唇形、動作、表情等通過模型計算渲染生產(chǎn)基于真人視頻進行學(xué)習(xí)和訓(xùn)練,成品數(shù)字人還原度高,有效降低維和感。
每經(jīng)科技產(chǎn)品經(jīng)理周宇翔表示,2022年對每經(jīng)科技而言是一個技術(shù)大年。2021年每日經(jīng)濟新聞與小冰公司合作,上線了每經(jīng)AI電視,依托N小黑、N小白兩位虛擬主播,進行24小時新聞播報。以此為契機,每經(jīng)科技開始了對自研虛擬人的摸索,并在2022年成功掌握了虛擬人自主建模和訓(xùn)練的能力。
2022年在虛擬人領(lǐng)域的技術(shù)突破以及與自身媒體業(yè)務(wù)相匹配的應(yīng)用場景,是周宇翔認(rèn)為每經(jīng)科技在2022年最大的成果之一。
周宇翔認(rèn)為,探索虛擬人,不僅是在媒體的業(yè)務(wù)場景中植入一個虛擬人形象,還能夠通過對虛擬人以及AI技術(shù)為代表的新興技術(shù)的探索,為媒體轉(zhuǎn)型提供技術(shù)思路和技術(shù)空間。他舉了個例子,受限于電視端等硬件條件,以往,紙媒要做類似于電視類的傳播媒介,是不可想象的,“每經(jīng)在轉(zhuǎn)型的過程中,其中一項重點是盡可能將各類傳播媒介進行融合應(yīng)用,來達到傳播效果的最佳程度,而虛擬人技術(shù)的誕生以及其在虛擬主播等領(lǐng)域的延伸應(yīng)用,為包括紙媒在內(nèi)的非電視端媒介提供了一個非常好的融合的機會。”
目前,每經(jīng)科技推出的雨燕智宣平臺已經(jīng)形成了自己的系列成品矩陣,其虛擬人除了未來可應(yīng)用于每經(jīng)AI電視以外,還可通過AI短視頻生成平臺、智慧微課平臺等系統(tǒng)應(yīng)用到資訊短視頻、投教類長視頻、品宣推廣視頻等制作環(huán)節(jié)中,利用新興技術(shù)的高效來大幅減輕甚至替代以往人工需要反復(fù)介入的工作。“虛擬人的技術(shù)本身只是一個單純的技術(shù),而和各行各業(yè)應(yīng)用場景結(jié)合,創(chuàng)造出更多價值,是虛擬人技術(shù)衍生出來后最大的意義所在。”
周宇翔表示,未來每經(jīng)科技也將繼續(xù)探索與更多實際業(yè)務(wù)、應(yīng)用場景相結(jié)合,“當(dāng)前虛擬人技術(shù)的價值核心表面上看是含‘科’量的提升,但歸根結(jié)底依舊在于解放人力資源,提高生產(chǎn)力。如果不能挖掘或者融入實際的應(yīng)用場景,其實對于市場來說沒有任何價值。怎么樣讓虛擬人從好看向好用轉(zhuǎn)化,這是我們做切入的重點方向。”
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP