每日經(jīng)濟新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

獨家專訪 | 阿里數(shù)字人技術負責人李小龍:更期待虛擬數(shù)字人“有趣的靈魂”

每日經(jīng)濟新聞 2022-03-17 12:40:58

◎目前在行業(yè)內,每個人對虛擬數(shù)字人的理解都不大一樣,或是因為缺乏標準化。在熱度過后,若想虛擬數(shù)字人行業(yè)真正邁入成熟期,或許還需要探索者們躬身于行,早日在技術上達成突破。

每經(jīng)記者 陳婷    每經(jīng)編輯 劉雪梅    

虛擬數(shù)字人(又稱“虛擬人”、“數(shù)字人”),時下正“當紅”。

只要在搜索引擎中輸入“虛擬數(shù)字人”相關的關鍵詞,便能看到不少相關消息,如:中央廣播電視總臺推出擁有超自然語音、超自然表情的超仿真主播“AI王冠”;奧飛娛樂回復投資者稱將打造更多的虛擬偶像;虛擬角色開發(fā)平臺Inworld AI完成1000萬美元融資......

啟信寶數(shù)據(jù)顯示,僅2021年國內就新增虛擬數(shù)字人相關企業(yè)超6萬家;投資領域更是大手筆頻出,2022年開年還不到一個月,虛擬數(shù)字人領域近百起融資累計金額已經(jīng)超過4億元。

而在結束不久的北京冬奧會期間,數(shù)十家公司更是集中推出了醞釀許久的虛擬數(shù)字人,他們在不同的應用場景內“發(fā)揮所長”。冬奧宣推官“冬冬”、數(shù)字記者“小諍”、“3D虛擬冰冰”、谷愛凌數(shù)字分身“meet gu”和手語主播“聆語”……據(jù)不完全統(tǒng)計,冬奧會期間,有將近30個虛擬數(shù)字人集中亮相,進一步推高了虛擬數(shù)字人的熱度。

某種程度上,2022年北京冬奧會,不但讓許多觀眾記住了“谷愛凌”、“蘇翊鳴”等明星運動員在冰天雪地里的矯健身姿,更成為了虛擬數(shù)字人行業(yè)發(fā)展上的分水嶺。

與之前更多是創(chuàng)業(yè)公司推出虛擬數(shù)字人不同,在冬奧會期間亮相的這些虛擬數(shù)字人背后,不乏赫赫有名的科技大企業(yè)。

公開資料顯示,“3D虛擬冰冰”是科大訊飛牽手央視后的產(chǎn)物,手語主播“聆語”則由騰訊云小微聯(lián)合PCG AI等技術團隊共同打造。而冬奧宣推官“冬冬”則是阿里推出的AI實時驅動的寫實數(shù)字人。

雖說虛擬數(shù)字人“熱”早已有之,但在本屆冬奧會之前,這股“熱潮”更多聚焦在以“顏值”見長的虛擬數(shù)字人上,如初音未來、AYAYI等,這些虛擬數(shù)字人被業(yè)內稱之為“虛擬偶像”,通過“圈粉”進行流量變現(xiàn)。

“科技大佬”們卻有著不一樣的思路。這些新鮮出爐的虛擬數(shù)字人,有著全然不同的“亮點”。他們的身份不再是此前場景的虛擬偶像,而是試圖去承擔諸如演播室主持人、電商直播間帶貨主播等更為多元化的職能。以阿里推出的虛擬數(shù)字人冬冬為例,冬冬的突破之處在于,實現(xiàn)了擬真人的實時交互能力。

為了深入了解虛擬人的普及情況,值此315之際,《每日經(jīng)濟新聞》聯(lián)合科創(chuàng)板首家數(shù)據(jù)分析提供商慧辰股份(688500.SH)特別針對Z世代進行調研,發(fā)布了2022新數(shù)智消費趨勢報告。(點擊鏈接看報告

當出眾的外表不再是必要條件,虛擬數(shù)字人當真還能吸引外界的目光嗎?虛擬數(shù)字人的“靈魂”和顏值,哪個更重要?基于這些圍繞著虛擬數(shù)字人的問題,阿里巴巴研究員、數(shù)字人技術負責人李小龍接受了《每日經(jīng)濟新聞》記者的獨家專訪。

核心觀點一:虛擬數(shù)字人需要“內外兼修”

或許是“肉體凡胎”的限制太過明顯,大眾已經(jīng)對“虛擬偶像”展現(xiàn)出了不小的熱情。

2021年央視春晚,虛擬偶像洛天依登臺與真人明星合作演出。在某短視頻平臺上,虛擬偶像柳夜熙有著超過860萬的粉絲,儼然已經(jīng)是一個“大網(wǎng)紅”。來自日本的初音未來更是成為了世界上第一個使用全息投影技術舉辦演唱會的虛擬偶像。

憑借著“超高”的顏值和正中Z世代胃口的“人設”,虛擬偶像可以做到在短時間內吸引到大量目光,這顯然是一條成效顯著的發(fā)展路線。一個潛力無限的市場正在這群虛擬偶像的面前緩緩拉開帷幕,iiMedia Research(艾媒咨詢)預測,2021年中國虛擬偶像核心產(chǎn)業(yè)市場規(guī)模將達到62.2億元,2023年將達205.5億元。

然而,相較于賦予虛擬數(shù)字人引人入勝的外形,記者發(fā)現(xiàn),阿里卻在追求虛擬數(shù)字人的“內外兼修”。

以阿里推出的虛擬數(shù)字人冬冬為例,李小龍一直強調著冬冬的“內在”能力。李小龍認為,冬冬的突破之處在于,實現(xiàn)了擬真人的實時交互能力。這得益于達摩院多項核心技術的支持。

阿里虛擬數(shù)字人冬冬 圖片來源:企業(yè)供圖

李小龍接受《每日經(jīng)濟新聞》記者采訪時表示,冬冬是一位AI實時驅動的擬真人級別的寫實數(shù)字人,不需要提前錄制或準備,她便可以實時與人交流和回答問題,甚至說脫口秀,能夠給用戶沉浸式的體驗。

相較于賦予虛擬數(shù)字人出色的外表,李小龍更希望虛擬數(shù)字人是有靈魂的、是可交互的。據(jù)設計師介紹,在“顏值”的設計上,設計師專門為冬冬設計了較為普通且常見的形象。

眾說紛紜中,阿里正試圖定義虛擬數(shù)字人的“標準”。在李小龍看來,虛擬數(shù)字人應當至少滿足以下條件之一,即能夠模擬或接近真人的外形、交互及動作,“能夠給人帶來特定場景下的真實體驗,這個初步定義的關鍵是,虛擬人需要在特定場景內真正解決人的問題。”

據(jù)了解,在深度融合了多模態(tài)理解和雙工對話管理技術的基礎上,達摩院構建了一套全智能驅動的數(shù)字人雙向互動能力,使得數(shù)字人具備“聽、看、演”的三位一體能力。此外,冬冬還具備自動言語生成的能力,即智能腳本生成能力(AI Script Generation,簡稱AISG)。

“我們希望冬冬能夠具備一個有趣的靈魂,是一個風趣幽默的形象。”李小龍表示,冬冬具備的智能腳本生成能力是一種綜合性能力,是自動的信息處理摘要、整個的結構化劇本生成和自動AI的脫口秀的生成等能力結合起來的結果,“當前市面上并沒有看到別的虛擬人有類似的能力。”

除了在技術上追求虛擬數(shù)字人的高互動性,在外表上,阿里結合其地域、性格等人物設定,通過AI算法與原型定位結合,賦予了冬冬與真人近似度較高的人物造型。

如果說外形是虛擬人的外在,那虛擬人的自動生成內容、與人互動等能力就是虛擬人的內核。在目前階段,打造“內外兼修”的虛擬人具備不低的技術門檻。這或許也是許多創(chuàng)業(yè)公司并沒有選擇從一開始就走這條道路的原因。

曾有報告總結過當前虛擬數(shù)字人行業(yè)內公司在發(fā)展路線上的不同選擇?!?021年虛擬數(shù)字人深度產(chǎn)業(yè)報告》顯示,在追一科技等廠商看來,技術是進入行業(yè)的核心門檻,需要進入玩家在機器視覺、語音交互和自然語言處理方面都具有身后的技術積累,并將三者有機結合。

科大訊飛則在技術方面強調了虛擬數(shù)字人向自我管理的演化,認知智能、靈活性、個性化、情感化都是虛擬數(shù)字人需要進一步提升的技術方面。虛擬數(shù)字人動作的細膩度和豐富度則為魔琺科技等廠商所強調。

“當前市場上的公司有很多種,有些公司將工作重點放在美術能力的突破上,有了美術能力的基礎,就可以大量生產(chǎn)出虛擬數(shù)字人的模型,雖然這些虛擬數(shù)字人可能還得靠真人去驅動。”李小龍表示。

“我們希望有一個更為長遠的規(guī)劃,結合整個XR技術的發(fā)展,我們需要找到一個可持續(xù)發(fā)展的路徑,”李小龍說。在他看來,只有通過技術創(chuàng)新上的突破,才能確立真正的競爭壁壘,“長久的商業(yè)化一定是通過技術創(chuàng)新實現(xiàn)的,這是毋庸置疑的。”

核心觀點二:虛擬數(shù)字人尚處于價值驗證階段

任何一個行業(yè)若想真正擁有長久地發(fā)展,則必然需要在市場上找到自己的存在價值。記者了解到,在當前階段,虛擬數(shù)字人已經(jīng)探索出一定的應用場景。

CIC灼識咨詢合伙人馮彥嬌告訴《每日經(jīng)濟新聞》記者,虛擬數(shù)字人目前主要在文娛、消費領域進行商業(yè)化變現(xiàn)。

“虛擬數(shù)字人也可被打造成IP,通過‘圈粉’進行流量變現(xiàn)。如打造虛擬偶像進行直播帶貨、獲取直播打賞、出售版權等;或是打造符合品牌調性的虛擬形象代言人進行品牌營銷活動。”馮彥嬌說。

馮彥嬌認為,在商業(yè)化探索上,虛擬數(shù)字人不過處于剛剛開跑的階段。究其原因,作為一個高科技物種,僅僅是通過“圈粉”變現(xiàn),想必并不是業(yè)內探索虛擬數(shù)字人的初衷。此外,相較于打造一個虛擬數(shù)字人所需要的成本,目前的虛擬數(shù)字人變現(xiàn)情況顯然并不盡如人意。

“在當前階段,若想要打造一個擬真人的、具備一定AI驅動能力的虛擬數(shù)字人,成本投入至少需要百萬以上。”李小龍說。

李小龍認為,虛擬數(shù)字人目前處于一個“價值驗證”階段,“在外界都很看好虛擬數(shù)字人的前景,但依然還處于大量投入的階段。”

“相對來說,阿里在虛擬數(shù)字人領域有商業(yè)化場景。”李小龍?zhí)岬剑⒗镆呀?jīng)在淘寶直播的場景中進行虛擬數(shù)字人應用落地嘗試,“當前階段,已經(jīng)有600多家商家在嘗試我們的虛擬主播,每天開播的超過200家。”

李小龍認為,對于虛擬數(shù)字人而言,電商直播間是一個已經(jīng)被驗證可行的商業(yè)化場景。

“虛擬數(shù)字人可以7*24小時進行直播,直播的商家不用去雇傭一個真人,這就幫助商家以更少的成本解決了效率的問題。”李小龍說。在他看來,通過對一個個小場景的探索,再逐漸拓展數(shù)字虛擬人業(yè)務的商業(yè)化空間不是紙上談兵。

據(jù)李小龍介紹,阿里在虛擬數(shù)字人業(yè)務的嘗試是由此前在智能客服業(yè)務上的積累孵化而來,目前在虛擬數(shù)字人業(yè)務上尚處于盈利探索期。對于這一個過程,李小龍表示他并不著急。他透露,“前期的探索和試水過程是必要的,智能客服大約摸索了五年左右才走上了大規(guī)模商業(yè)化落地的階段。”

僅就電商相關的場景而言,李小龍預測,虛擬數(shù)字人可以在五年之內達到每年700億到1000億的市場空間。

至于整體虛擬數(shù)字人的市場空間,《2021年虛擬數(shù)字人深度產(chǎn)業(yè)報告》預計,到2030年我國虛擬數(shù)字人整體市場規(guī)模將達到2700億元,迎來廣闊的應用空間。

圖表來源:《2021年虛擬數(shù)字人深度產(chǎn)業(yè)報告》

除了電商之外,李小龍表示,很多虛擬數(shù)字人的應用場景都是值得探索的,但這是一個循序漸進的發(fā)展過程,“一定是在有限場景下進行逐步的迭代,先解決有限場景下的有些問題,然后慢慢跨場景、進入多個場景進行探索。”

以冬冬為例,便是阿里在場景探索上的最新嘗試。據(jù)李小龍介紹,冬冬的具體的應用上可以跨越兩個場景:不僅是一個可以在演播室展現(xiàn)出采訪能力的主持人和記者,也是一名可以在直播間進行控場和賣貨的帶貨主播。

核心觀點三:虛擬數(shù)字人行業(yè)需要走向“標準化”

雖說商業(yè)化空間前景喜人,在對于未來的探索上,虛擬數(shù)字人產(chǎn)業(yè)尚還面臨著一些需要突破的難題。

根據(jù)《2021年虛擬數(shù)字人深度產(chǎn)業(yè)報告》,虛擬數(shù)字人產(chǎn)業(yè)目前的行業(yè)門檻及瓶頸主要來源于三個方面,即上限偏高的技術和美術門檻;客戶積累帶來的業(yè)務認知以及在各細分市場亟待實現(xiàn)的標準化復制。

據(jù)李小龍介紹,目前虛擬數(shù)字人在技術上的難點主要在生成、驅動及交互上,“當這三個難點都能夠得以突破,虛擬數(shù)字人大規(guī)模的生成和應用便成為了可能,剩下都便是如何去鋪開場景的問題。”

相較于技術上的難題,李小龍透露,虛擬數(shù)字人在行業(yè)標準上的匱乏,也成為了限制虛擬數(shù)字人大規(guī)模商業(yè)化落地的主要原因之一。

上述報告提到,對于國內企業(yè),由于主要應對的場景高度定制化,大規(guī)?;瘡椭粕洗嬖谝欢▎栴},導致虛擬數(shù)字人的應用無法快速推廣到各行業(yè)。

“目前在行業(yè)內,每個人對虛擬數(shù)字人的理解都不大一樣,就是因為缺乏標準化。”李小龍表示,“我們也在積極推動整個行業(yè)走向標準化,包括評測的標準化、技術方向的標準化。

只是,虛擬數(shù)字人行業(yè)若當真突破了目前所存在的瓶頸,又將給外界帶來哪些變化?

馮彥嬌認為,隨著未來技術的成熟與開發(fā)成本的下降,虛擬數(shù)字人將在各行各業(yè)得到普及。除了目前應用較多的文娛、消費領域;在各企業(yè)級場景,虛擬數(shù)字人也將開始在客服、營銷、導覽、心理咨詢等場景得到應用。

李小龍則認為,未來將進入一個人機協(xié)同的世界,“我相信,在一個特定場景中,虛擬數(shù)字人確實能夠發(fā)展到接近真人的水平,能夠幫助人類在人機協(xié)同情況下大幅提升工作效率。”

“我們研發(fā)虛擬數(shù)字人并不是希望他們去替代人類工作,這在短期內也是不可能的。在未來,虛擬數(shù)字人可以代替人類從事一些簡單、重復、難度不是那么大的工作,真正難度比較大的那部分工作,還是需要人類來完成。”李小龍進一步解釋道。

不過,這都是后話了。當前的種種跡象表明,擺在行業(yè)探索者們面前的路還很長。在熱度過后,若想虛擬數(shù)字人行業(yè)真正邁入成熟期,或許還需要探索者們躬身于行,早日在技術上達成突破。

對于虛擬數(shù)字人當前的熱潮,李小龍有著相對清醒的認知。“虛擬數(shù)字人行業(yè)會呈現(xiàn)出一個曲線形的發(fā)展趨勢。當前階段,行業(yè)被炒到頂點,但由于投入產(chǎn)出比太低,已經(jīng)呈現(xiàn)出往下降的趨勢,之后會慢慢進入一個穩(wěn)定上升的階段。”李小龍預測。

 

封面圖片來源:攝圖網(wǎng)_500545987

封面圖片來源:企業(yè)供圖

如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

2

0

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人 在线 免费