每日經(jīng)濟(jì)新聞 2024-06-27 11:34:31
每經(jīng)記者 王帆 每經(jīng)編輯 文多
6月26日,《每日經(jīng)濟(jì)新聞》記者獲悉,新一代實(shí)時(shí)語(yǔ)音編碼行業(yè)標(biāo)準(zhǔn)AVS3P10即將正式發(fā)布。這是一項(xiàng)基于AI神經(jīng)網(wǎng)絡(luò)等技術(shù)的全新行業(yè)標(biāo)準(zhǔn),解決的是弱網(wǎng)環(huán)境下的語(yǔ)音通信質(zhì)量問(wèn)題。該標(biāo)準(zhǔn)由騰訊提議啟動(dòng)、推進(jìn)和維護(hù),經(jīng)AVS(數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)工作組)多家成員單位共同貢獻(xiàn)。
過(guò)往的音頻傳輸場(chǎng)景中,在有限的帶寬條件下,想要將聲音高質(zhì)量傳遞到接收方,關(guān)鍵在于壓縮原始數(shù)據(jù)、去除冗余信息的語(yǔ)音編碼技術(shù)。然而,基于EVS、OPUS等現(xiàn)有主流音頻編解碼標(biāo)準(zhǔn),當(dāng)碼率降低到10kbps以下時(shí),語(yǔ)音質(zhì)量下降明顯,影響用戶體驗(yàn)。這也造成了在電梯、地庫(kù)、隧道等弱網(wǎng)環(huán)境下實(shí)時(shí)語(yǔ)音通話不暢的難題。
而本次制定的新標(biāo)準(zhǔn)AVS3P10,解決上述痛點(diǎn)的技術(shù)路徑是:首先通過(guò)建立語(yǔ)音信號(hào)處理和深度神經(jīng)網(wǎng)絡(luò),捕捉音頻的核心特征,實(shí)現(xiàn)大幅度壓縮、降低傳輸?shù)臄?shù)據(jù)量;再借助深度學(xué)習(xí)網(wǎng)絡(luò),重建語(yǔ)音信號(hào),恢復(fù)出高質(zhì)量的聲音。在保持高清音質(zhì)的同時(shí),大幅降低了音頻傳輸?shù)膸捫枨?,讓用戶在各種場(chǎng)景下都能享受到既清晰又省流量的音頻體驗(yàn)。
《每日經(jīng)濟(jì)新聞》記者注意到,AI技術(shù)此前在實(shí)時(shí)語(yǔ)音傳輸領(lǐng)域已有語(yǔ)音增強(qiáng)、回聲消除、降噪、變聲、語(yǔ)音識(shí)別與合成等研究和應(yīng)用。例如,字節(jié)跳動(dòng)火山引擎流媒體音頻團(tuán)隊(duì)曾發(fā)布包括語(yǔ)音增強(qiáng)、基于AI編解碼、回聲消除、無(wú)監(jiān)督自適應(yīng)語(yǔ)音增強(qiáng)等方面的相關(guān)研究成果;阿里巴巴釘釘蜂鳴鳥(niǎo)音頻實(shí)驗(yàn)室提出了一種基于頻—時(shí)調(diào)制譜的改進(jìn)型窄帶濾波網(wǎng)絡(luò)(STSubNet)和“一模型,多任務(wù)”方案,聯(lián)合消除實(shí)時(shí)語(yǔ)音通信中常見(jiàn)的三種干擾音(回聲,噪音和混響)。
而騰訊上述標(biāo)準(zhǔn)和技術(shù)的發(fā)布,意味著AI在實(shí)時(shí)語(yǔ)音傳輸新增了一個(gè)應(yīng)用場(chǎng)景和技術(shù)路徑。
值得一提的是,這一標(biāo)準(zhǔn)以騰訊首款神經(jīng)網(wǎng)絡(luò)語(yǔ)音編解碼器Penguins為原型,該技術(shù)在2021年起逐步落地到騰訊會(huì)議車載模式、弱網(wǎng)模式、QQ語(yǔ)音通話等多個(gè)產(chǎn)品場(chǎng)景中。那么,為何騰訊會(huì)選擇推動(dòng)一項(xiàng)自研技術(shù)成為行業(yè)標(biāo)準(zhǔn),并把關(guān)鍵核心技術(shù)開(kāi)放出來(lái)?
在6月26日的媒體群訪中,騰訊云副總裁、騰訊會(huì)議天籟實(shí)驗(yàn)室主任商世東回應(yīng)記者稱:“這一標(biāo)準(zhǔn)的制定和技術(shù)的開(kāi)放,能推動(dòng)整個(gè)實(shí)時(shí)語(yǔ)音通信行業(yè)為用戶提供更好的技術(shù)和產(chǎn)品。”商世東認(rèn)為,騰訊不怕開(kāi)放技術(shù),因?yàn)榧夹g(shù)在具體產(chǎn)品里面怎么使用,以及怎么做到效果和體驗(yàn)最好,取決于很多技術(shù)開(kāi)發(fā)細(xì)節(jié),這不是拿到開(kāi)放的源代碼就能輕易做到的。“對(duì)于同行來(lái)說(shuō),他們看到這個(gè)技術(shù)的領(lǐng)先性后,最快在市場(chǎng)上推出產(chǎn)品的方法就是和騰訊一起合作,實(shí)現(xiàn)一加一大于二的效果。”他表示。
騰訊標(biāo)準(zhǔn)化高級(jí)工程師張亞軍認(rèn)為:“標(biāo)準(zhǔn)化是行業(yè)達(dá)成共識(shí)的形式和方法,也能解決產(chǎn)品設(shè)備互聯(lián)互通的問(wèn)題。制定標(biāo)準(zhǔn)的過(guò)程需要產(chǎn)業(yè)鏈上的各個(gè)廠商都加入討論,比如芯片廠商、終端廠商、互聯(lián)網(wǎng)APP廠商。并不是說(shuō)某一家企業(yè)技術(shù)足夠厲害,它就可以吃得下整個(gè)‘蛋糕’。標(biāo)準(zhǔn)化可以讓大家一起做大‘蛋糕’,一起來(lái)推動(dòng)我們行業(yè)的發(fā)展。”他還表示,另一方面,雖然標(biāo)準(zhǔn)是開(kāi)放的,但標(biāo)準(zhǔn)里的技術(shù)方案是有相應(yīng)的專利和IP保護(hù)的,因此開(kāi)放對(duì)于騰訊來(lái)說(shuō)并沒(méi)有太大顧慮。
封面圖片來(lái)源:視覺(jué)中國(guó)
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP