每日經(jīng)濟(jì)新聞 2024-04-11 11:56:47
“大模界”是每日經(jīng)濟(jì)新聞推出一檔專(zhuān)注生成式AI與大模型技術(shù)的前沿科技報(bào)道欄目。
在這里,我們將聚焦生成式AI技術(shù)浪潮,展現(xiàn)從文字、圖像、音頻、視頻的大模型如何編織數(shù)字化世界。
在這里,我們將解碼、評(píng)測(cè)國(guó)內(nèi)外各類(lèi)大模型,探究它們?nèi)绾纬蔀樽兏锔餍懈鳂I(yè)的重要力量。
在這里,我們將關(guān)注AIGC行業(yè)發(fā)展,聯(lián)手行業(yè)領(lǐng)軍人物和頂尖專(zhuān)家,共同揭示最新產(chǎn)品創(chuàng)新和技術(shù)突破,前瞻未來(lái)發(fā)展趨勢(shì)。
歡迎關(guān)注“大模界”,您將見(jiàn)證AIGC如何重塑內(nèi)容生態(tài),如何以前沿之力推動(dòng)社會(huì)進(jìn)步。讓我們共同開(kāi)啟一場(chǎng)關(guān)于AI新紀(jì)元的無(wú)限旅程!
每經(jīng)記者 畢媛媛 宋美璐 每經(jīng)編輯 梁梟
“改變是潛移默化的,可能就在某個(gè)平凡的日子,一首觸動(dòng)心靈的歌曲闖入你的生活,當(dāng)你深入了解其源頭時(shí),發(fā)現(xiàn)那是AI寫(xiě)的,那時(shí)候浪潮就悄悄來(lái)臨了。”伯雅文娛創(chuàng)始人、唱作人范志昊說(shuō)道。這位音樂(lè)制作行業(yè)的資深人士正致力于探索AI在音樂(lè)創(chuàng)作中的輔助作用。“總有人會(huì)做這些事,你永遠(yuǎn)無(wú)法阻擋歷史車(chē)輪的腳步。”
Suno上生成的關(guān)于貓的音樂(lè) 很熱門(mén) 圖片來(lái)源:Suno截圖
近來(lái),SunoV3等音樂(lè)AI技術(shù)的誕生,如同一股強(qiáng)勁的暗流,沖擊著傳統(tǒng)音樂(lè)行業(yè)的壁壘,引發(fā)了眾多音樂(lè)從業(yè)者對(duì)未來(lái)職業(yè)前景的憂(yōu)慮,他們同時(shí)也在思考如何在AI時(shí)代中找到自己的位置。
六間房視頻集團(tuán)創(chuàng)始人、Bit Computing Pte.Ltd.創(chuàng)始人/CEO劉巖如今正在開(kāi)發(fā)一款音樂(lè)大模型,他在接受《每日經(jīng)濟(jì)新聞》記者電話(huà)采訪(fǎng)時(shí)表示:“當(dāng)前市面上部分被冠以‘音樂(lè)大模型’之名的產(chǎn)品,其實(shí)并未達(dá)到嚴(yán)格意義上大模型的標(biāo)準(zhǔn)。音樂(lè)大模型因其更高的技術(shù)門(mén)檻、更窄的應(yīng)用場(chǎng)景,或不會(huì)出現(xiàn)大規(guī)模爆發(fā)的情況,但有可能超越國(guó)外成為全球領(lǐng)先。”
自今年3月以來(lái),國(guó)內(nèi)外涌現(xiàn)出大量AI生成式音樂(lè)工具,行業(yè)格局在一夜之間發(fā)生了翻天覆地的變化。
此前,OpenAI的MuseNet、谷歌的MusicLM以及Meta的MusicGen等AI音樂(lè)項(xiàng)目已經(jīng)引起了業(yè)界廣泛關(guān)注。而如今,一款名為Suno的“音樂(lè)版ChatGPT”音樂(lè)大模型點(diǎn)燃了全球音樂(lè)界的熱情。因?yàn)檫@款模型能夠一次性完成歌詞、演唱、編曲、配樂(lè)等音樂(lè)創(chuàng)作的全過(guò)程,因此被譽(yù)為“消滅”了音樂(lè)創(chuàng)作門(mén)檻。
音樂(lè)制作人閆東煒在第一時(shí)間試用了Suno,他興奮地表示:“輸入幾個(gè)關(guān)鍵詞,不到一分鐘就能生成了。”然而,他也指出了Suno的局限性:雖然借助AI可以找音樂(lè)靈感,但聽(tīng)多了感覺(jué)出來(lái)的基本都是流行歌。未來(lái)抖音上的歌可能會(huì)越來(lái)越相似,像流水線(xiàn)一樣生產(chǎn)。如果要不斷地坐在電腦前輸入關(guān)鍵詞來(lái)生成歌曲,這個(gè)過(guò)程可能會(huì)顯得有些無(wú)聊。
盡管如此,Suno仍然獲得了不少業(yè)內(nèi)人士的高度評(píng)價(jià)。范志昊評(píng)價(jià):Suno生成的音樂(lè)是有下限的,它的創(chuàng)作至少聽(tīng)著順耳。
Suno上生成的另一首關(guān)于貓的音樂(lè) 收聽(tīng)量超過(guò)1萬(wàn)+ 圖片來(lái)源:Suno截圖
范志昊表示,可以借助AI預(yù)測(cè)音樂(lè)內(nèi)容,并幫助公司找到合適的歌手。此外,AI還降低了音樂(lè)創(chuàng)作的門(mén)檻,讓更多人能夠享受到創(chuàng)作的樂(lè)趣。“本來(lái)聽(tīng)到好的作品會(huì)有共鳴,但如果變成自己去寫(xiě),快樂(lè)是不一樣的。這個(gè)市場(chǎng)的潛在需求非常大。”范志昊坦言。
AI音樂(lè)引發(fā)熱潮的另一個(gè)重要原因在于使用門(mén)檻和價(jià)格的降低。以閆東煒使用過(guò)的一款A(yù)I音樂(lè)工具為例,基礎(chǔ)版免費(fèi),PRO版價(jià)格大約是10美元一個(gè)月,能生成500首歌;更高級(jí)的版本只需30美元一個(gè)月,就能生成約2000首歌。這意味著,一首AI歌曲的成本僅需0.1元左右。
范志昊表示:“原先找專(zhuān)業(yè)作曲人創(chuàng)作歌曲的成本很高,即使是友情價(jià)也得是千元以上。但現(xiàn)在有了AI,幾十塊錢(qián)就能生成上百條音樂(lè)作品,價(jià)格差距非常大。”他還提到,如果機(jī)器不排隊(duì)的話(huà),幾乎可以即刻生成一個(gè)詞曲的demo(樣片)。
AI音樂(lè)并非完美無(wú)缺。閆東煒認(rèn)為,AI可以創(chuàng)作,但不善于修改。每次修改完都完全不一樣,因此較為復(fù)雜的歌曲客戶(hù)還是會(huì)找人工來(lái)做。盡管如此,他認(rèn)為AI音樂(lè)在技術(shù)上已經(jīng)高過(guò)很多網(wǎng)絡(luò)上的口水歌。
范志昊也坦言,國(guó)內(nèi)的AI工具和Suno相比仍有一定差距。雖然音樂(lè)AI能夠生成各種風(fēng)格的歌曲,但水平卻參差不齊。其中,pop和爵士風(fēng)格相對(duì)較為出色。pop風(fēng)格之所以讓人驚喜,是因?yàn)槠溆?xùn)練數(shù)據(jù)豐富,結(jié)構(gòu)相對(duì)可復(fù)制;而爵士風(fēng)格則因?yàn)槟軐?xiě)出好風(fēng)格的人本身就比較少,所以顯得尤為亮眼。
據(jù)媒體報(bào)道,當(dāng)?shù)貢r(shí)間4月2日,200多名國(guó)際樂(lè)壇知名音樂(lè)人聯(lián)署公開(kāi)信,呼吁AI開(kāi)發(fā)者、科技公司、平臺(tái)和數(shù)字音樂(lè)服務(wù)商停止使用AI侵犯及貶低人類(lèi)藝術(shù)家的權(quán)利,要求他們承諾不開(kāi)發(fā)與之相關(guān)的AI音樂(lè)生成技術(shù)等,也不能拒絕向藝術(shù)家提供合理報(bào)酬。參與聯(lián)署的藝人共有246名,大多來(lái)自歐美樂(lè)壇,其中包括比莉·艾利什(Billie Eilish)、凱蒂·佩里(Katy Perry)、妮琪·米娜(Nick Minaj)等。
妮琪·米娜 圖片來(lái)源:環(huán)球音樂(lè)官網(wǎng)
近年來(lái),AI音樂(lè)生成技術(shù)迅速發(fā)展,一系列以“AI歌手”為名的翻唱作品在網(wǎng)絡(luò)上走紅。例如,“AI孫燕姿”翻唱的《發(fā)如雪》、“AI王心凌”翻唱的《套馬桿》等視頻,播放量均超過(guò)百萬(wàn)。隨后,“AI周杰倫”“AI林俊杰”“AI許嵩”等“歌手”也如雨后春筍般涌現(xiàn)。
相關(guān)技術(shù)的普及也引發(fā)了社會(huì)各界的擔(dān)憂(yōu)。許多行業(yè)人士擔(dān)心,AI的廣泛應(yīng)用可能會(huì)危及他們的生計(jì)和職業(yè)發(fā)展。對(duì)此,閆東煒表示,雖然AI對(duì)音樂(lè)創(chuàng)作者的影響有限,但確實(shí)降低了普通人進(jìn)入音樂(lè)創(chuàng)作的門(mén)檻,這可能會(huì)對(duì)整個(gè)音樂(lè)行業(yè)產(chǎn)生一定的沖擊。“流行歌手不會(huì)失業(yè),粉絲喜歡的是這個(gè)人,他唱得好,有作品更好。”
閆東煒進(jìn)一步解釋說(shuō),現(xiàn)在客戶(hù)只需將需求發(fā)送給AI,便能快速生成音樂(lè)作品,這在一定程度上減少了對(duì)傳統(tǒng)音樂(lè)制作公司的需求。然而,他也強(qiáng)調(diào),AI生成的音樂(lè)往往結(jié)構(gòu)單一,對(duì)于專(zhuān)業(yè)領(lǐng)域的需求幫助有限。音樂(lè)制作人仍需要根據(jù)客戶(hù)需求進(jìn)行后期的修改和調(diào)整,以確保作品的質(zhì)量和獨(dú)特性。
“AI最先替代的就是藝術(shù)家,人工智能可以體驗(yàn)無(wú)數(shù)次戀愛(ài)、失戀、死亡,因此他會(huì)比人更有情感,AI在其他領(lǐng)域最大的問(wèn)題是‘幻覺(jué)’,可能會(huì)造成誤判,但這種‘幻覺(jué)’在藝術(shù)上就可能是突破和創(chuàng)新。”劉巖說(shuō)。
范志昊表示,AI對(duì)音樂(lè)行業(yè)的影響是雙面的。它既可以降低創(chuàng)作門(mén)檻,讓更多人能夠嘗試音樂(lè)創(chuàng)作;也可能導(dǎo)致一部分人的工作被AI替代,尤其依賴(lài)簡(jiǎn)單創(chuàng)作和翻唱的藝人可能失去工作機(jī)會(huì),例如有些唱demo的歌手已經(jīng)被替代了。
“AI對(duì)音樂(lè)人的沖擊并不是直接的競(jìng)爭(zhēng),而是潛移默化的競(jìng)爭(zhēng)。AI音樂(lè)的普及可能會(huì)改變音樂(lè)人的職業(yè)發(fā)展方向。”在范志昊看來(lái),未來(lái),音樂(lè)人可能更需要注重個(gè)人IP的經(jīng)營(yíng)和發(fā)展,而非僅僅依賴(lài)于網(wǎng)絡(luò)歌曲的翻唱和創(chuàng)作。
此外,范志昊還提到了未來(lái)音樂(lè)產(chǎn)業(yè)的發(fā)展趨勢(shì)。他表示,隨著音樂(lè)產(chǎn)量的不斷增加,每年人們能夠聽(tīng)到的歌曲數(shù)量已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了他們的消化能力。AI的出現(xiàn)進(jìn)一步加劇了音樂(lè)市場(chǎng)的競(jìng)爭(zhēng),搶占了原有的音樂(lè)空間。這導(dǎo)致一些認(rèn)真做曲庫(kù)、做內(nèi)容的音樂(lè)人可能會(huì)受到影響,他們的作品可能會(huì)因?yàn)锳I的普及而被淹沒(méi)在海量的音樂(lè)中。
對(duì)于AI音樂(lè)對(duì)傳統(tǒng)市場(chǎng)的沖擊問(wèn)題,劉巖也表達(dá)了自己的看法。他認(rèn)為,AI音樂(lè)生成技術(shù)能夠在短時(shí)間內(nèi)產(chǎn)生大量歌曲,以目前能力和需求看,一年后,市場(chǎng)上90%的歌曲可能都是AI生成的了,傳統(tǒng)意義上的“新歌”可能連1%的比例都占不到了,僅從數(shù)據(jù)上看,行業(yè)的格局一定會(huì)被打破。
音樂(lè)大模型的發(fā)展正處于一個(gè)關(guān)鍵時(shí)期。繼Suno之后,國(guó)內(nèi)的科技公司也不甘落后,昆侖萬(wàn)維推出了“天工SkyMusic”,發(fā)布的9首由“天工SkyMusic”生成的音樂(lè)作品,展示了從說(shuō)唱到古風(fēng)等多種風(fēng)格的音樂(lè)創(chuàng)作能力,這些作品的時(shí)長(zhǎng)從10秒到51秒不等。
一年前,劉巖和他的團(tuán)隊(duì)就敲下音樂(lè)大模型開(kāi)發(fā)的第一行代碼,決心布局該行業(yè)。在他看來(lái),音樂(lè)大模型相較于文字和視頻大模型,面臨著更高的技術(shù)門(mén)檻。“音樂(lè)和視頻一樣是一種長(zhǎng)時(shí)序的技術(shù)形式,如果說(shuō)視頻可以分成每一秒鐘24幀圖像的話(huà),音樂(lè)則每一秒鐘包含上萬(wàn)個(gè)采樣點(diǎn),且每個(gè)采樣點(diǎn)之間的相關(guān)性強(qiáng),這使得音樂(lè)成為最復(fù)雜的模態(tài)之一。”
劉巖進(jìn)一步闡述道,當(dāng)前市面上部分被冠以“音樂(lè)大模型”之名的產(chǎn)品,其實(shí)并未達(dá)到嚴(yán)格意義上大模型的標(biāo)準(zhǔn)。一些作品的生成依賴(lài)于音樂(lè)結(jié)構(gòu)和規(guī)則的技術(shù),或是通過(guò)將音樂(lè)轉(zhuǎn)化為MIDI等符號(hào)語(yǔ)言再進(jìn)入模型來(lái)實(shí)現(xiàn),這種方式雖然能夠產(chǎn)生近人類(lèi)水平的音樂(lè),但不能觸及音樂(lè)的本質(zhì)——對(duì)音樂(lè)情感、內(nèi)涵及整體結(jié)構(gòu)的理解與創(chuàng)造性表達(dá),永遠(yuǎn)不會(huì)超越現(xiàn)有音樂(lè)的水平。
“真正意義上的音樂(lè)大模型應(yīng)當(dāng)具備端到端的學(xué)習(xí)能力,訓(xùn)練數(shù)據(jù)直接來(lái)源于日常聆聽(tīng)的完整音樂(lè)作品而非翻譯后的MIDI,并能夠從構(gòu)思歌詞、設(shè)計(jì)旋律、編排伴奏直至模擬人聲演繹等全過(guò)程進(jìn)行一體化的創(chuàng)作。遺憾的是,當(dāng)前大多數(shù)模型僅在音樂(lè)創(chuàng)作的旋律和伴奏等某一個(gè)環(huán)節(jié)上取得進(jìn)展,尚未實(shí)現(xiàn)全方位的音樂(lè)生成。”劉巖說(shuō)。
目前用戶(hù)無(wú)法透視模型的內(nèi)部邏輯,只能看到其外在表現(xiàn)。劉巖認(rèn)為,AI這一天然的“黑盒”效應(yīng),讓音樂(lè)大模型出現(xiàn)了不少魚(yú)目混珠的情況。然而,“黑盒”效應(yīng)也為中小企業(yè)和創(chuàng)業(yè)團(tuán)隊(duì)帶來(lái)了獨(dú)特的發(fā)展機(jī)遇。
Suno生成了大量各類(lèi)音樂(lè) 圖片來(lái)源:Suno截圖
范志昊早在半年前就開(kāi)始集結(jié)團(tuán)隊(duì),專(zhuān)注于研究音樂(lè)AIGC輔助生態(tài)。他認(rèn)為,“黑盒”是小公司跟大廠競(jìng)爭(zhēng)的唯一的壁壘,因?yàn)榛ヂ?lián)網(wǎng)產(chǎn)品的運(yùn)作邏輯可以輕易被剖析和模仿,而AI則不然,這就要求開(kāi)發(fā)者投入更多的心血與專(zhuān)注。在他看來(lái),這不是大廠有錢(qián)就可以做好的。“除非他一下子砸很多錢(qián)進(jìn)去,但這又不是一個(gè)潛力特別大的市場(chǎng)。”
與語(yǔ)言大模型廣泛應(yīng)用于多元場(chǎng)景不同,音樂(lè)大模型從誕生之初便瞄準(zhǔn)了特定的應(yīng)用場(chǎng)景——降低音樂(lè)創(chuàng)作門(mén)檻,使以往專(zhuān)業(yè)音樂(lè)人才方能完成的工作,如今普通人借助大模型只需通過(guò)自然語(yǔ)言描述就能得到高質(zhì)量的歌曲作品。
這一點(diǎn)使音樂(lè)大模型在特定領(lǐng)域具有一定的市場(chǎng)潛力。劉巖認(rèn)為:“語(yǔ)言大模型我們很難超越,但音樂(lè)大模型我們可以把它做成全世界最好的模型。”
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線(xiàn):4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP