每日經(jīng)濟(jì)新聞 2024-12-10 19:42:26
12月10日凌晨,OpenAI正式推出視頻生成工具Sora的高端加速版——Sora Turbo,距首次預(yù)告Sora已過300天。利用該工具,用戶可以通過文字、圖像或其他視頻素材,生成長達(dá)20秒的視頻。Sora的推出受到廣泛歡迎,服務(wù)器直接被擠到崩潰。從用戶分享的視頻看,Sora的生成效果還是很不錯(cuò),但有用戶指出,其依然面臨著物理規(guī)則理解的挑戰(zhàn)。
每經(jīng)記者 蔡鼎 每經(jīng)實(shí)習(xí)記者 岳楚鵬 每經(jīng)編輯 蘭素英
12月10日凌晨,OpenAI的12天特別活動(dòng)的第3天,備受外界期待的視頻生成工具Sora終于正式登場。
Sora的首次預(yù)告是在2月16日,當(dāng)時(shí)OpenAI提供了數(shù)十個(gè)演示視頻,展示了一個(gè)令人驚嘆的未來:任何人都可以通過在計(jì)算機(jī)程序中輸入簡單的文本提示來制作高質(zhì)量的短片。
然而,在隨后的300天內(nèi),Sora始終停留在預(yù)告階段,未能面世。而在這期間,包括Meta、谷歌和亞馬遜在內(nèi)的幾家大型科技公司都展示了自己的視頻生成模型,國內(nèi)的可靈和海螺也在海外大放異彩,成為外網(wǎng)一度討論最熱烈的視頻生成模型。
采用最新發(fā)布的Sora Turbo,用戶可以通過文字、圖像或其他視頻素材,生成長達(dá)20秒的視頻。目前,該工具已在美國和其他部分市場面向ChatGPT Plus和Pro用戶開放。
Sora官網(wǎng)上線后,用戶蜂擁而入,火爆的需求很快就導(dǎo)致網(wǎng)站崩潰,公司CEO山姆·奧爾特曼(Sam Altman)表示:“我們嚴(yán)重低估了Sora的需求,要讓每個(gè)人都能訪問還需要一段時(shí)間。”
而拿到訪問權(quán)限的用戶也在網(wǎng)上陸續(xù)分享Sora生成的視頻,不難看出,Sora還是有不少驚喜,但有用戶也反饋稱,Sora對物理規(guī)律的理解并不夠好,仍會(huì)出現(xiàn)人的手部不自然、文字亂碼、動(dòng)物跑著跑著就飛起來等情況。
12月10日凌晨,OpenAI正式發(fā)布Sora Turbo。這距離該公司首次公開發(fā)布這一產(chǎn)品的預(yù)覽已經(jīng)過去300天。
目前,http://sora.com網(wǎng)站已經(jīng)上線,美國及其他市場的ChatGPT付費(fèi)用戶可以通過該網(wǎng)站開始使用Sora,但在歐洲大部分地區(qū)和英國還需要一段時(shí)間才能使用。相比最初預(yù)告的Sora版本,Sora Turbo模型增加了文本生成視頻、動(dòng)畫圖像和混合視頻等功能。
OpenAI表示,ChatGPT Plus訂閱用戶可以生成最多50個(gè)視頻,分辨率最高可達(dá)720p,時(shí)長為5秒。而通過上周推出的“史上最貴”的、每月收費(fèi)200美元的ChatGPT Pro服務(wù),用戶最多可以生成500個(gè)視頻,可以同時(shí)生成5個(gè)視頻,時(shí)長為20秒,分辨率最高為1080p,并且,訂閱者可以下載沒有水印的視頻。
圖片來源:OpenAI
奧爾特曼與Sora團(tuán)隊(duì)負(fù)責(zé)人比爾·皮布爾斯(Bill Peebles)、阿迪亞·拉梅什(Aditya Ramesh)進(jìn)行了約20分鐘的直播對Sora進(jìn)行介紹。在直播中,他們展示了Sora的新探索頁面,其中包含一些用戶制作的AI生成的視頻。
OpenAI重點(diǎn)介紹了一項(xiàng)名為“故事板”的功能,該功能可讓用戶根據(jù)一系列提示生成視頻,以及將照片轉(zhuǎn)換為視頻。OpenAI還演示了一個(gè)“混合”工具,可讓您使用文本提示調(diào)整Sora的輸出,還可以將兩個(gè)場景“混合”在一起生成一個(gè)新的場景。
圖片來源:X
對于Sora的發(fā)布以及意料之外的視頻編輯功能,著名AI評論員Rowan Cheung評價(jià)道:“圣誕節(jié)提前來到了AI世界”。
圖片來源:X
針對之前一直被提及的安全問題,OpenAI表示,使用Sora生成的視頻將帶有可見的水印和C2PA元數(shù)據(jù),以表明它們是使用AI制作的。在將圖像或視頻上傳到Sora之前,OpenAI會(huì)提示您勾選一項(xiàng)協(xié)議,該協(xié)議規(guī)定您上傳的內(nèi)容不包含未成年人、露骨或暴力內(nèi)容以及受版權(quán)保護(hù)的材料。OpenAI表示,“濫用媒體上傳”可能會(huì)導(dǎo)致帳戶被禁止或暫停。
Sora的產(chǎn)品負(fù)責(zé)人Rohan Sahai表示:“我們面臨著巨大的壓力,我們希望防止Sora的非法活動(dòng),但我們也希望在創(chuàng)造性表達(dá)與非法活動(dòng)之間取得平衡。”
奧爾特曼在直播中表示,對于OpenAI而言,Sora不僅僅是一項(xiàng)技術(shù),更是一種賦能創(chuàng)意人士的工具。在OpenAI的文化基因中,用AI激發(fā)人類創(chuàng)造力也很重要。通過Sora,OpenAI看到了AI和人類共同創(chuàng)造的全新協(xié)作模式。文本曾是人機(jī)交互主要形式,但他們堅(jiān)信這遠(yuǎn)遠(yuǎn)不夠,視頻能夠傳遞更多的情感和細(xì)節(jié)。同時(shí),Sora對于OpenAI而言,不僅僅是一個(gè)視頻生成工具,更是AGI(通用人工智能)之路的重要里程碑。
Sora官網(wǎng)上線后,不少用戶蜂擁而入,希望成為第一批體驗(yàn)該模型的幸運(yùn)兒。結(jié)果,由于需求量太大,OpenAI不得不暫時(shí)關(guān)閉了Sora帳戶的創(chuàng)建功能。
奧爾特曼在X平臺(tái)上發(fā)文稱,“我們嚴(yán)重低估了Sora的需求,要讓每個(gè)人都能訪問還需要一段時(shí)間。正在試圖找出如何盡快做到這一點(diǎn)!”
圖片來源:X
OpenAI暫時(shí)沒有回應(yīng)在關(guān)閉之前到底有多少人成功創(chuàng)建賬戶,也沒有透露何時(shí)恢復(fù)創(chuàng)建賬戶功能,但獲得了訪問權(quán)限的用戶正在社交媒體上分享他們的作品。
有用戶完全模擬了一個(gè)玫瑰從花蕾綻放到盛開的延時(shí)視頻,看上去就和紀(jì)錄片里的一模一樣。
圖片來源:X
還有網(wǎng)友模擬了80年代日本繁忙的街頭。
圖片來源:X
知名科技博主MKBHD也放出了一段模擬真實(shí)新聞的視頻。除了字幕有一點(diǎn)亂碼以外,其他和真實(shí)新聞場景看上去沒有什么區(qū)別。
圖片來源:X
OpenAI員工Will Depue也放出了一段它模擬的生成的一段虛假的歷史視頻,真實(shí)和虛幻之間感覺已經(jīng)快分不開了。
圖片來源:X
不過也有人反饋,Sora對物理規(guī)律的理解并不夠好,仍會(huì)出現(xiàn)人的手部不自然、文字亂碼、動(dòng)物跑著跑著就飛起來等情況。比如,在上面?zhèn)卧斓臍v史視頻中,如果仔細(xì)看其實(shí)會(huì)發(fā)現(xiàn)中間有一個(gè)騎兵是倒著騎馬的。
還有網(wǎng)友將Sora和在之前在國外大火的海螺模型和Sora做比較,用相同的提示詞來生成一段末日機(jī)器人視頻。
圖片來源:X
Sora版本
海螺版本
更有人直接把海外最熱門的幾個(gè)生成模型(可靈,Sora,Runway,海螺)拉在一起比較,最后得出結(jié)論:從電影制作的角度來看,可靈的效果最實(shí)用;Sora的效果最好(但如果鏡頭不正確,一切都不正確);海螺在某些情況下很好,但感覺很弱且不一致;Runway在工作流程方面是最好的,但它并不可控的。AI視頻生成本身就是迭代的,因此與緩慢、漂亮但不正確的相比,快速和精簡是一個(gè)不錯(cuò)的功能。
圖片來源:X
Sora版本
可靈版本
海螺版本
怪不得有網(wǎng)友評論道:“每個(gè)人都對OpenAI Sora感到興奮,但目前對我來說,最適合制作視頻還得是海螺和可靈”。
圖片來源:X
隨著Sora的面世,視頻生成大模型的賽道競爭無疑將會(huì)越來越激烈。上周,騰訊也發(fā)布了參數(shù)量高達(dá)130億的元寶AI視頻生成模型,是當(dāng)前最大的視頻開源模型。
圖片來源:騰訊元寶
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP