每日經(jīng)濟(jì)新聞

要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

“即夢(mèng)AI”上架，字節(jié)能否在視頻大模型上趕超快手？

每日經(jīng)濟(jì)新聞 2024-08-16 12:51:36

每經(jīng)記者楊昕怡每經(jīng)編輯魏官紅孫磊

“壓力給到了抖音剪映?！痹诮衲?月以快手自研視頻生成大模型可靈為代表的現(xiàn)象級(jí)生成式AI（人工智能）產(chǎn)品涌現(xiàn)時(shí)，外界無(wú)一不在期待字節(jié)進(jìn)一步的表現(xiàn)。

近日，字節(jié)跳動(dòng)旗下剪映團(tuán)隊(duì)研發(fā)的一站式AI創(chuàng)作平臺(tái)“即夢(mèng)AI”移動(dòng)版正式上架至蘋(píng)果App Store應(yīng)用商店。

《每日經(jīng)濟(jì)新聞》記者了解到，該應(yīng)用目前擁有文生圖和文/圖生視頻等功能。另外，即夢(mèng)已經(jīng)上線會(huì)員體系，推出多個(gè)訂閱方式。

通過(guò)對(duì)即夢(mèng)、可靈以及Sora的實(shí)際應(yīng)用對(duì)比，《每日經(jīng)濟(jì)新聞》記者體驗(yàn)發(fā)現(xiàn)，三款視頻生成大模型在對(duì)提示詞的捕捉和理解上都較為準(zhǔn)確、完整，但即夢(mèng)的人物塑造、內(nèi)容的豐富度和視頻流暢度等能力相對(duì)有所欠缺。在生成內(nèi)容的時(shí)長(zhǎng)上，即夢(mèng)支持最多12秒的視頻生成。

“生成流暢視頻的秒數(shù)是判斷一個(gè)視頻生成大模型能力優(yōu)劣的關(guān)鍵因素?！币晃淮竽Ｐ凸こ處熢诮邮堋睹咳战?jīng)濟(jì)新聞》記者采訪時(shí)表示，“‘流暢’需要從多個(gè)維度來(lái)看，比如生成的內(nèi)容有沒(méi)有事實(shí)錯(cuò)誤、記憶能力如何以及空間感對(duì)不對(duì)等。”

CFF20LXzkOz7jIRj3LStWQNQaDJfbDNnk2Cgeib0LFblzhj8xXfIsVRBQFo43jy4YmaHyK5DGGB1ia92d5vMZdkw.png

“即夢(mèng)AI”移動(dòng)版上架圖片來(lái)源：應(yīng)用截圖

“即夢(mèng)AI”上架 效果趕超可靈？

今年年初，Sora的橫空出世開(kāi)啟了“視頻的ChatGPT時(shí)代”，隨后，快手推出的“黑馬”可靈讓人們對(duì)國(guó)產(chǎn)AI視頻大模型的表現(xiàn)有了越來(lái)越多的期待。同為短視頻巨頭的抖音母公司字節(jié)跳動(dòng)，則被視為賽道內(nèi)最具趕超可能性的選手之一。

CFF20LXzkOz7jIRj3LStWQNQaDJfbDNnILicLXSgxULheHia3RIgofwWBVuMStZ5ufoKeDr2Gd7qyLnDbVgjm8hA.jpg

可靈AI網(wǎng)頁(yè)端? 圖片來(lái)源：官網(wǎng)截圖

3月底，字節(jié)旗下剪映團(tuán)隊(duì)研發(fā)的AI創(chuàng)作平臺(tái)“即夢(mèng)AI”開(kāi)放內(nèi)測(cè)；5月9日，該應(yīng)用上線網(wǎng)頁(yè)版，上線之初只有圖片生成、智能畫(huà)布和視頻生成三大功能，目前已上新故事創(chuàng)作功能；8月6日，該應(yīng)用移動(dòng)版正式上架至蘋(píng)果App Store應(yīng)用商店，現(xiàn)擁有文生圖和文/圖生視頻等功能。

CFF20LXzkOz7jIRj3LStWQNQaDJfbDNngpS86X6gbET3Sia3fJibrZuIvDH8qelhVsUFgOsV2LAyW3ibYZrkpFoibQ.png

即夢(mèng)AI網(wǎng)頁(yè)端? 圖片來(lái)源：官網(wǎng)截圖

至于即夢(mèng)的實(shí)際使用效果，今年7月初，全國(guó)首部AIGC生成式連續(xù)性敘事科幻短劇集《三星堆：未來(lái)啟示錄》在抖音上線。在這部總共13集的短劇集里，即夢(mèng)作為首席AI技術(shù)支持方，借助了包括AIGC劇本創(chuàng)作、概念及分鏡設(shè)計(jì)、圖像到視頻轉(zhuǎn)換、視頻編輯和媒體內(nèi)容增強(qiáng)等10種AI技術(shù)。

據(jù)媒體報(bào)道，在和博納影業(yè)合作推出《三星堆：未來(lái)啟示錄》的過(guò)程中，即夢(mèng)AI改進(jìn)了“視頻生成”功能，包括支持24fps、30fps、60fps的補(bǔ)幀以及二倍超分的能力，新增鏡頭水平移動(dòng)、上下移動(dòng)，支持鏡頭移動(dòng)的方向和幅度控制等。

CFF20LXzkOz7jIRj3LStWQNQaDJfbDNnu5WmsYibwuTlraL7TQSxceV40jfoicJfhcibL4RFxvS3OlsAaRpVz1UNA.png

圖片來(lái)源：剪映微信公眾號(hào)截圖

在即夢(mèng)App上線后，《每日經(jīng)濟(jì)新聞》記者選取了OpenAI官方公布的多條Sora視頻提示詞對(duì)即夢(mèng)、可靈和Sora進(jìn)行對(duì)比測(cè)試。

從記者的測(cè)試結(jié)果來(lái)看，三款視頻生成大模型在對(duì)提示詞的捕捉和理解上都較為準(zhǔn)確、完整，生成視頻內(nèi)容的畫(huà)面表現(xiàn)也都連貫且流暢。

但在人物形象的刻畫(huà)精細(xì)度上，Sora相較于即夢(mèng)和可靈有一定的優(yōu)勢(shì)；在動(dòng)作的自然度上，即夢(mèng)在三個(gè)測(cè)試產(chǎn)品中略遜一籌，例如在以“東京街頭的女士”為主題的視頻畫(huà)面呈現(xiàn)上，即夢(mèng)生成的人物在轉(zhuǎn)頭時(shí)頭頸部略顯扭曲，拎包的手部動(dòng)作也有所變形。

CFF20LXzkOz7jIRj3LStWQNQaDJfbDNnH9s0HxibUiacNXduBvGLVQBTeibINTibZd4nvt6GDbylxfrOan6aXh0ibLw.png

圖片來(lái)源：記者生成視頻截圖

而在生產(chǎn)內(nèi)容的元素豐富程度上，Sora也在三者中表現(xiàn)更優(yōu)。例如在以“太空人”為主題的生成視頻內(nèi)容里，Sora給出了飛船、艙外景象等多個(gè)有關(guān)提示詞的聯(lián)想內(nèi)容，而即夢(mèng)和可靈僅呈現(xiàn)了一個(gè)穿著宇航服的男性角色。

CFF20LXzkOz7jIRj3LStWQNQaDJfbDNnjQWagHx7Bs03AaCxcrg9qmiblSLvMiaLL7xWQibePVqAKXbymR1ZREcrA.png

圖片來(lái)源：記者生成視頻截圖

易觀分析研究合伙人陳晨在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示，在生成效果上，即夢(mèng)的AI圖像的整體質(zhì)量較好，AI視頻則在時(shí)長(zhǎng)、元素豐富性、動(dòng)作連貫性等細(xì)節(jié)處理上仍然有所欠缺。

“（元素內(nèi)容不夠豐富）更多有關(guān)模型的對(duì)齊，不過(guò)如果缺失了從‘太空人’聯(lián)想到‘飛船’的能力，是基座模型的能力問(wèn)題。”一位大模型工程師向《每日經(jīng)濟(jì)新聞》記者指出，生成流暢視頻的秒數(shù)是判斷一個(gè)視頻生成大模型能力優(yōu)劣的關(guān)鍵因素，“‘流暢’需要從多個(gè)維度來(lái)看，比如生成的內(nèi)容有沒(méi)有事實(shí)錯(cuò)誤、記憶能力如何以及空間感對(duì)不對(duì)等”。

《每日經(jīng)濟(jì)新聞》記者通過(guò)試用發(fā)現(xiàn)，在輸入相同提示詞的情況下，要求生成的視頻越長(zhǎng)，視頻主體形象和動(dòng)作的精度、流暢程度很可能會(huì)相應(yīng)受損。

目前，即夢(mèng)支持3秒、6秒、9秒和12秒的視頻內(nèi)容生成，分別對(duì)應(yīng)不同的積分消耗。而Sora早在發(fā)布時(shí)就已經(jīng)能合成1分鐘超長(zhǎng)視頻；6月21日，可靈推出了圖生視頻功能，支持根據(jù)不同文本內(nèi)容，將靜態(tài)圖像轉(zhuǎn)化為生動(dòng)的5秒視頻，且續(xù)寫(xiě)功能可讓視頻延續(xù)約5秒，最長(zhǎng)可生成約3分鐘視頻。

AI視頻會(huì)是大模型的掘金點(diǎn)嗎？

Sora的出現(xiàn)無(wú)疑給大模型開(kāi)辟了一方新的賽場(chǎng)——今年7月，阿里達(dá)摩院發(fā)布了一站式AI視頻創(chuàng)作平臺(tái)“尋光”，商湯推出了首個(gè)面向C端用戶的可控人物視頻生成大模型Vimi，智譜也宣布將AI生成視頻模型清影（Ying）正式上線智譜清言??

在AI頭部玩家集體向視頻生成大模型發(fā)起猛攻時(shí)，一個(gè)不能回避的問(wèn)題就在眼前：AI視頻能讓大模型公司賺到錢嗎？

以業(yè)內(nèi)明星公司OpenAI為例，在推出了Sora等一眾能力領(lǐng)先的大模型的情況下，今年7月，有媒體援引知情人士以及未公開(kāi)的內(nèi)部財(cái)務(wù)數(shù)據(jù)分析稱，OpenAI今年或面臨高達(dá)50億美元的巨額虧損，預(yù)估公司全年收入預(yù)估可能在35億～45億美元，遠(yuǎn)低于運(yùn)營(yíng)成本。

同時(shí)，國(guó)內(nèi)視頻大模型在商業(yè)化落地上也顯得有些“著急”。7月30日，可靈上線了面向全球的會(huì)員體系，該體系與其在國(guó)內(nèi)市場(chǎng)推出的會(huì)員體系相仿，例如月卡分為10美元、37美元和92美元三檔，可對(duì)應(yīng)生成約66個(gè)、300個(gè)和800個(gè)5秒視頻。

《每日經(jīng)濟(jì)新聞》記者注意到，即夢(mèng)也已推出會(huì)員體系，有79元單月、69元連續(xù)包月和659元包年的基礎(chǔ)會(huì)員的不同訂閱方式。具體來(lái)說(shuō)，基礎(chǔ)會(huì)員每月可使用505個(gè)積分生成約2020張圖片或168個(gè)AI視頻。此外，還有每月2020個(gè)積分的標(biāo)準(zhǔn)會(huì)員和每月6555個(gè)積分的高級(jí)會(huì)員服務(wù)即將上線。

“由于AI大模型高昂的模型訓(xùn)練與推理成本，加之C端用戶對(duì)AI工具的需求相對(duì)分散，付費(fèi)意愿不足，視頻大模型在C端市場(chǎng)的商業(yè)化仍然會(huì)面臨一個(gè)較長(zhǎng)的培育期?！标惓空J(rèn)為，對(duì)于C端市場(chǎng)而言，視頻大模型的商業(yè)化落地仍道阻且長(zhǎng)。

而從B端市場(chǎng)出發(fā)，陳晨向《每日經(jīng)濟(jì)新聞》記者表示，“對(duì)于B端而言，AI技術(shù)革命正在重塑原有的工作流程，壓縮冗余環(huán)節(jié)并引發(fā)新的創(chuàng)作工具需求。在這個(gè)過(guò)程中，AI視頻大模型可以逐步與現(xiàn)有的影視制作、廣告創(chuàng)意、媒體內(nèi)容策劃結(jié)合，輔助進(jìn)行復(fù)雜工序自動(dòng)化處理和智能化內(nèi)容生產(chǎn)。而模型能力是否有效嵌入實(shí)際工作流程，帶來(lái)實(shí)質(zhì)性的效率提升、成本降低，是構(gòu)建商業(yè)化能力的關(guān)鍵因素”。

“Kimi的商業(yè)化會(huì)逐步開(kāi)始探索，但還不是目前的重點(diǎn)，目前的重點(diǎn)還是打造能力更強(qiáng)的下一代模型。”今年8月，月之暗面方面在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)曾表示，現(xiàn)階段還不是以商業(yè)化為重的時(shí)候。

也許，對(duì)“初出茅廬”的即夢(mèng)來(lái)說(shuō)也是如此，它還有一個(gè)又一個(gè)里程碑要去觸達(dá)、超越?！凹磯?mèng)目前的產(chǎn)品功能、商業(yè)模式聚焦于服務(wù)UGC（用戶生成內(nèi)容），與抖音的生態(tài)融合也將是未來(lái)的發(fā)展重點(diǎn)。”陳晨表示，“或許在時(shí)長(zhǎng)、幀率、畫(huà)面細(xì)節(jié)等技術(shù)參數(shù)上的直接對(duì)標(biāo)并不是即夢(mèng)現(xiàn)階段最需要關(guān)注的，關(guān)鍵還是在于應(yīng)用落地和生態(tài)整合能力?！?/span>

記者|楊昕怡

編輯|魏官紅?孫磊?蓋源源

校對(duì)|何小桃

｜每日經(jīng)濟(jì)新聞 ?nbdnews??原創(chuàng)文章｜

未經(jīng)許可禁止轉(zhuǎn)載、摘編、復(fù)制及鏡像等使用

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

10萬(wàn)人告別事業(yè)編制“鐵飯碗”？山東人社廳回應(yīng)：是誤讀

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

日本6月第三產(chǎn)業(yè)活動(dòng)指數(shù)月率-1.3%

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁(yè)

Copyright ? 2024 每日經(jīng)濟(jì)新聞報(bào)社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會(huì)征信網(wǎng)

兒童色情信息舉報(bào)專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

四川省互聯(lián)網(wǎng)舉報(bào)中心

中國(guó)互聯(lián)網(wǎng)舉報(bào)中心

每日經(jīng)濟(jì)新聞互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號(hào)：蜀ICP備19004508號(hào)-3 川公網(wǎng)安備 51019002002026號(hào)

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人在线免费