每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

獨家專訪 | 阿里數(shù)字人技術(shù)負(fù)責(zé)人李小龍:更期待虛擬數(shù)字人“有趣的靈魂”

每日經(jīng)濟(jì)新聞 2022-03-17 12:40:58

◎目前在行業(yè)內(nèi),每個人對虛擬數(shù)字人的理解都不大一樣,或是因為缺乏標(biāo)準(zhǔn)化。在熱度過后,若想虛擬數(shù)字人行業(yè)真正邁入成熟期,或許還需要探索者們躬身于行,早日在技術(shù)上達(dá)成突破。

每經(jīng)記者 陳婷    每經(jīng)編輯 劉雪梅    

虛擬數(shù)字人(又稱“虛擬人”、“數(shù)字人”),時下正“當(dāng)紅”。

只要在搜索引擎中輸入“虛擬數(shù)字人”相關(guān)的關(guān)鍵詞,便能看到不少相關(guān)消息,如:中央廣播電視總臺推出擁有超自然語音、超自然表情的超仿真主播“AI王冠”;奧飛娛樂回復(fù)投資者稱將打造更多的虛擬偶像;虛擬角色開發(fā)平臺Inworld AI完成1000萬美元融資......

啟信寶數(shù)據(jù)顯示,僅2021年國內(nèi)就新增虛擬數(shù)字人相關(guān)企業(yè)超6萬家;投資領(lǐng)域更是大手筆頻出,2022年開年還不到一個月,虛擬數(shù)字人領(lǐng)域近百起融資累計金額已經(jīng)超過4億元。

而在結(jié)束不久的北京冬奧會期間,數(shù)十家公司更是集中推出了醞釀許久的虛擬數(shù)字人,他們在不同的應(yīng)用場景內(nèi)“發(fā)揮所長”。冬奧宣推官“冬冬”、數(shù)字記者“小諍”、“3D虛擬冰冰”、谷愛凌數(shù)字分身“meet gu”和手語主播“聆語”……據(jù)不完全統(tǒng)計,冬奧會期間,有將近30個虛擬數(shù)字人集中亮相,進(jìn)一步推高了虛擬數(shù)字人的熱度。

某種程度上,2022年北京冬奧會,不但讓許多觀眾記住了“谷愛凌”、“蘇翊鳴”等明星運動員在冰天雪地里的矯健身姿,更成為了虛擬數(shù)字人行業(yè)發(fā)展上的分水嶺。

與之前更多是創(chuàng)業(yè)公司推出虛擬數(shù)字人不同,在冬奧會期間亮相的這些虛擬數(shù)字人背后,不乏赫赫有名的科技大企業(yè)。

公開資料顯示,“3D虛擬冰冰”是科大訊飛牽手央視后的產(chǎn)物,手語主播“聆語”則由騰訊云小微聯(lián)合PCG AI等技術(shù)團(tuán)隊共同打造。而冬奧宣推官“冬冬”則是阿里推出的AI實時驅(qū)動的寫實數(shù)字人。

雖說虛擬數(shù)字人“熱”早已有之,但在本屆冬奧會之前,這股“熱潮”更多聚焦在以“顏值”見長的虛擬數(shù)字人上,如初音未來、AYAYI等,這些虛擬數(shù)字人被業(yè)內(nèi)稱之為“虛擬偶像”,通過“圈粉”進(jìn)行流量變現(xiàn)。

“科技大佬”們卻有著不一樣的思路。這些新鮮出爐的虛擬數(shù)字人,有著全然不同的“亮點”。他們的身份不再是此前場景的虛擬偶像,而是試圖去承擔(dān)諸如演播室主持人、電商直播間帶貨主播等更為多元化的職能。以阿里推出的虛擬數(shù)字人冬冬為例,冬冬的突破之處在于,實現(xiàn)了擬真人的實時交互能力。

為了深入了解虛擬人的普及情況,值此315之際,《每日經(jīng)濟(jì)新聞》聯(lián)合科創(chuàng)板首家數(shù)據(jù)分析提供商慧辰股份(688500.SH)特別針對Z世代進(jìn)行調(diào)研,發(fā)布了2022新數(shù)智消費趨勢報告。(點擊鏈接看報告

當(dāng)出眾的外表不再是必要條件,虛擬數(shù)字人當(dāng)真還能吸引外界的目光嗎?虛擬數(shù)字人的“靈魂”和顏值,哪個更重要?基于這些圍繞著虛擬數(shù)字人的問題,阿里巴巴研究員、數(shù)字人技術(shù)負(fù)責(zé)人李小龍接受了《每日經(jīng)濟(jì)新聞》記者的獨家專訪。

核心觀點一:虛擬數(shù)字人需要“內(nèi)外兼修”

或許是“肉體凡胎”的限制太過明顯,大眾已經(jīng)對“虛擬偶像”展現(xiàn)出了不小的熱情。

2021年央視春晚,虛擬偶像洛天依登臺與真人明星合作演出。在某短視頻平臺上,虛擬偶像柳夜熙有著超過860萬的粉絲,儼然已經(jīng)是一個“大網(wǎng)紅”。來自日本的初音未來更是成為了世界上第一個使用全息投影技術(shù)舉辦演唱會的虛擬偶像。

憑借著“超高”的顏值和正中Z世代胃口的“人設(shè)”,虛擬偶像可以做到在短時間內(nèi)吸引到大量目光,這顯然是一條成效顯著的發(fā)展路線。一個潛力無限的市場正在這群虛擬偶像的面前緩緩拉開帷幕,iiMedia Research(艾媒咨詢)預(yù)測,2021年中國虛擬偶像核心產(chǎn)業(yè)市場規(guī)模將達(dá)到62.2億元,2023年將達(dá)205.5億元。

然而,相較于賦予虛擬數(shù)字人引人入勝的外形,記者發(fā)現(xiàn),阿里卻在追求虛擬數(shù)字人的“內(nèi)外兼修”。

以阿里推出的虛擬數(shù)字人冬冬為例,李小龍一直強調(diào)著冬冬的“內(nèi)在”能力。李小龍認(rèn)為,冬冬的突破之處在于,實現(xiàn)了擬真人的實時交互能力。這得益于達(dá)摩院多項核心技術(shù)的支持。

阿里虛擬數(shù)字人冬冬 圖片來源:企業(yè)供圖

李小龍接受《每日經(jīng)濟(jì)新聞》記者采訪時表示,冬冬是一位AI實時驅(qū)動的擬真人級別的寫實數(shù)字人,不需要提前錄制或準(zhǔn)備,她便可以實時與人交流和回答問題,甚至說脫口秀,能夠給用戶沉浸式的體驗。

相較于賦予虛擬數(shù)字人出色的外表,李小龍更希望虛擬數(shù)字人是有靈魂的、是可交互的。據(jù)設(shè)計師介紹,在“顏值”的設(shè)計上,設(shè)計師專門為冬冬設(shè)計了較為普通且常見的形象。

眾說紛紜中,阿里正試圖定義虛擬數(shù)字人的“標(biāo)準(zhǔn)”。在李小龍看來,虛擬數(shù)字人應(yīng)當(dāng)至少滿足以下條件之一,即能夠模擬或接近真人的外形、交互及動作,“能夠給人帶來特定場景下的真實體驗,這個初步定義的關(guān)鍵是,虛擬人需要在特定場景內(nèi)真正解決人的問題。”

據(jù)了解,在深度融合了多模態(tài)理解和雙工對話管理技術(shù)的基礎(chǔ)上,達(dá)摩院構(gòu)建了一套全智能驅(qū)動的數(shù)字人雙向互動能力,使得數(shù)字人具備“聽、看、演”的三位一體能力。此外,冬冬還具備自動言語生成的能力,即智能腳本生成能力(AI Script Generation,簡稱AISG)。

“我們希望冬冬能夠具備一個有趣的靈魂,是一個風(fēng)趣幽默的形象。”李小龍表示,冬冬具備的智能腳本生成能力是一種綜合性能力,是自動的信息處理摘要、整個的結(jié)構(gòu)化劇本生成和自動AI的脫口秀的生成等能力結(jié)合起來的結(jié)果,“當(dāng)前市面上并沒有看到別的虛擬人有類似的能力。”

除了在技術(shù)上追求虛擬數(shù)字人的高互動性,在外表上,阿里結(jié)合其地域、性格等人物設(shè)定,通過AI算法與原型定位結(jié)合,賦予了冬冬與真人近似度較高的人物造型。

如果說外形是虛擬人的外在,那虛擬人的自動生成內(nèi)容、與人互動等能力就是虛擬人的內(nèi)核。在目前階段,打造“內(nèi)外兼修”的虛擬人具備不低的技術(shù)門檻。這或許也是許多創(chuàng)業(yè)公司并沒有選擇從一開始就走這條道路的原因。

曾有報告總結(jié)過當(dāng)前虛擬數(shù)字人行業(yè)內(nèi)公司在發(fā)展路線上的不同選擇?!?021年虛擬數(shù)字人深度產(chǎn)業(yè)報告》顯示,在追一科技等廠商看來,技術(shù)是進(jìn)入行業(yè)的核心門檻,需要進(jìn)入玩家在機器視覺、語音交互和自然語言處理方面都具有身后的技術(shù)積累,并將三者有機結(jié)合。

科大訊飛則在技術(shù)方面強調(diào)了虛擬數(shù)字人向自我管理的演化,認(rèn)知智能、靈活性、個性化、情感化都是虛擬數(shù)字人需要進(jìn)一步提升的技術(shù)方面。虛擬數(shù)字人動作的細(xì)膩度和豐富度則為魔琺科技等廠商所強調(diào)。

“當(dāng)前市場上的公司有很多種,有些公司將工作重點放在美術(shù)能力的突破上,有了美術(shù)能力的基礎(chǔ),就可以大量生產(chǎn)出虛擬數(shù)字人的模型,雖然這些虛擬數(shù)字人可能還得靠真人去驅(qū)動。”李小龍表示。

“我們希望有一個更為長遠(yuǎn)的規(guī)劃,結(jié)合整個XR技術(shù)的發(fā)展,我們需要找到一個可持續(xù)發(fā)展的路徑,”李小龍說。在他看來,只有通過技術(shù)創(chuàng)新上的突破,才能確立真正的競爭壁壘,“長久的商業(yè)化一定是通過技術(shù)創(chuàng)新實現(xiàn)的,這是毋庸置疑的。”

核心觀點二:虛擬數(shù)字人尚處于價值驗證階段

任何一個行業(yè)若想真正擁有長久地發(fā)展,則必然需要在市場上找到自己的存在價值。記者了解到,在當(dāng)前階段,虛擬數(shù)字人已經(jīng)探索出一定的應(yīng)用場景。

CIC灼識咨詢合伙人馮彥嬌告訴《每日經(jīng)濟(jì)新聞》記者,虛擬數(shù)字人目前主要在文娛、消費領(lǐng)域進(jìn)行商業(yè)化變現(xiàn)。

“虛擬數(shù)字人也可被打造成IP,通過‘圈粉’進(jìn)行流量變現(xiàn)。如打造虛擬偶像進(jìn)行直播帶貨、獲取直播打賞、出售版權(quán)等;或是打造符合品牌調(diào)性的虛擬形象代言人進(jìn)行品牌營銷活動。”馮彥嬌說。

馮彥嬌認(rèn)為,在商業(yè)化探索上,虛擬數(shù)字人不過處于剛剛開跑的階段。究其原因,作為一個高科技物種,僅僅是通過“圈粉”變現(xiàn),想必并不是業(yè)內(nèi)探索虛擬數(shù)字人的初衷。此外,相較于打造一個虛擬數(shù)字人所需要的成本,目前的虛擬數(shù)字人變現(xiàn)情況顯然并不盡如人意。

“在當(dāng)前階段,若想要打造一個擬真人的、具備一定AI驅(qū)動能力的虛擬數(shù)字人,成本投入至少需要百萬以上。”李小龍說。

李小龍認(rèn)為,虛擬數(shù)字人目前處于一個“價值驗證”階段,“在外界都很看好虛擬數(shù)字人的前景,但依然還處于大量投入的階段。”

“相對來說,阿里在虛擬數(shù)字人領(lǐng)域有商業(yè)化場景。”李小龍?zhí)岬剑⒗镆呀?jīng)在淘寶直播的場景中進(jìn)行虛擬數(shù)字人應(yīng)用落地嘗試,“當(dāng)前階段,已經(jīng)有600多家商家在嘗試我們的虛擬主播,每天開播的超過200家。”

李小龍認(rèn)為,對于虛擬數(shù)字人而言,電商直播間是一個已經(jīng)被驗證可行的商業(yè)化場景。

“虛擬數(shù)字人可以7*24小時進(jìn)行直播,直播的商家不用去雇傭一個真人,這就幫助商家以更少的成本解決了效率的問題。”李小龍說。在他看來,通過對一個個小場景的探索,再逐漸拓展數(shù)字虛擬人業(yè)務(wù)的商業(yè)化空間不是紙上談兵。

據(jù)李小龍介紹,阿里在虛擬數(shù)字人業(yè)務(wù)的嘗試是由此前在智能客服業(yè)務(wù)上的積累孵化而來,目前在虛擬數(shù)字人業(yè)務(wù)上尚處于盈利探索期。對于這一個過程,李小龍表示他并不著急。他透露,“前期的探索和試水過程是必要的,智能客服大約摸索了五年左右才走上了大規(guī)模商業(yè)化落地的階段。”

僅就電商相關(guān)的場景而言,李小龍預(yù)測,虛擬數(shù)字人可以在五年之內(nèi)達(dá)到每年700億到1000億的市場空間。

至于整體虛擬數(shù)字人的市場空間,《2021年虛擬數(shù)字人深度產(chǎn)業(yè)報告》預(yù)計,到2030年我國虛擬數(shù)字人整體市場規(guī)模將達(dá)到2700億元,迎來廣闊的應(yīng)用空間。

圖表來源:《2021年虛擬數(shù)字人深度產(chǎn)業(yè)報告》

除了電商之外,李小龍表示,很多虛擬數(shù)字人的應(yīng)用場景都是值得探索的,但這是一個循序漸進(jìn)的發(fā)展過程,“一定是在有限場景下進(jìn)行逐步的迭代,先解決有限場景下的有些問題,然后慢慢跨場景、進(jìn)入多個場景進(jìn)行探索。”

以冬冬為例,便是阿里在場景探索上的最新嘗試。據(jù)李小龍介紹,冬冬的具體的應(yīng)用上可以跨越兩個場景:不僅是一個可以在演播室展現(xiàn)出采訪能力的主持人和記者,也是一名可以在直播間進(jìn)行控場和賣貨的帶貨主播。

核心觀點三:虛擬數(shù)字人行業(yè)需要走向“標(biāo)準(zhǔn)化”

雖說商業(yè)化空間前景喜人,在對于未來的探索上,虛擬數(shù)字人產(chǎn)業(yè)尚還面臨著一些需要突破的難題。

根據(jù)《2021年虛擬數(shù)字人深度產(chǎn)業(yè)報告》,虛擬數(shù)字人產(chǎn)業(yè)目前的行業(yè)門檻及瓶頸主要來源于三個方面,即上限偏高的技術(shù)和美術(shù)門檻;客戶積累帶來的業(yè)務(wù)認(rèn)知以及在各細(xì)分市場亟待實現(xiàn)的標(biāo)準(zhǔn)化復(fù)制。

據(jù)李小龍介紹,目前虛擬數(shù)字人在技術(shù)上的難點主要在生成、驅(qū)動及交互上,“當(dāng)這三個難點都能夠得以突破,虛擬數(shù)字人大規(guī)模的生成和應(yīng)用便成為了可能,剩下都便是如何去鋪開場景的問題。”

相較于技術(shù)上的難題,李小龍透露,虛擬數(shù)字人在行業(yè)標(biāo)準(zhǔn)上的匱乏,也成為了限制虛擬數(shù)字人大規(guī)模商業(yè)化落地的主要原因之一。

上述報告提到,對于國內(nèi)企業(yè),由于主要應(yīng)對的場景高度定制化,大規(guī)?;瘡?fù)制上存在一定問題,導(dǎo)致虛擬數(shù)字人的應(yīng)用無法快速推廣到各行業(yè)。

“目前在行業(yè)內(nèi),每個人對虛擬數(shù)字人的理解都不大一樣,就是因為缺乏標(biāo)準(zhǔn)化。”李小龍表示,“我們也在積極推動整個行業(yè)走向標(biāo)準(zhǔn)化,包括評測的標(biāo)準(zhǔn)化、技術(shù)方向的標(biāo)準(zhǔn)化。

只是,虛擬數(shù)字人行業(yè)若當(dāng)真突破了目前所存在的瓶頸,又將給外界帶來哪些變化?

馮彥嬌認(rèn)為,隨著未來技術(shù)的成熟與開發(fā)成本的下降,虛擬數(shù)字人將在各行各業(yè)得到普及。除了目前應(yīng)用較多的文娛、消費領(lǐng)域;在各企業(yè)級場景,虛擬數(shù)字人也將開始在客服、營銷、導(dǎo)覽、心理咨詢等場景得到應(yīng)用。

李小龍則認(rèn)為,未來將進(jìn)入一個人機協(xié)同的世界,“我相信,在一個特定場景中,虛擬數(shù)字人確實能夠發(fā)展到接近真人的水平,能夠幫助人類在人機協(xié)同情況下大幅提升工作效率。”

“我們研發(fā)虛擬數(shù)字人并不是希望他們?nèi)ヌ娲祟惞ぷ鳎@在短期內(nèi)也是不可能的。在未來,虛擬數(shù)字人可以代替人類從事一些簡單、重復(fù)、難度不是那么大的工作,真正難度比較大的那部分工作,還是需要人類來完成。”李小龍進(jìn)一步解釋道。

不過,這都是后話了。當(dāng)前的種種跡象表明,擺在行業(yè)探索者們面前的路還很長。在熱度過后,若想虛擬數(shù)字人行業(yè)真正邁入成熟期,或許還需要探索者們躬身于行,早日在技術(shù)上達(dá)成突破。

對于虛擬數(shù)字人當(dāng)前的熱潮,李小龍有著相對清醒的認(rèn)知。“虛擬數(shù)字人行業(yè)會呈現(xiàn)出一個曲線形的發(fā)展趨勢。當(dāng)前階段,行業(yè)被炒到頂點,但由于投入產(chǎn)出比太低,已經(jīng)呈現(xiàn)出往下降的趨勢,之后會慢慢進(jìn)入一個穩(wěn)定上升的階段。”李小龍預(yù)測。

 

封面圖片來源:攝圖網(wǎng)_500545987

封面圖片來源:企業(yè)供圖

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

2

0

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人 在线 免费