每日經(jīng)濟(jì)新聞

頭條

每經(jīng)網(wǎng)首頁 > 頭條 > 正文

OpenAI首席技術(shù)官最新透露：Sora預(yù)計(jì)將在今年發(fā)布，計(jì)劃加入語音功能，還有這些“干貨”

每日經(jīng)濟(jì)新聞 2024-03-15 09:36:41

每經(jīng)編輯杜宇

OpenAI似乎已經(jīng)在為Sora降世預(yù)熱了。

當(dāng)?shù)貢r(shí)間3月13日周三，OpenAI首席技術(shù)官米拉·穆拉蒂（Mira Murati）接受了《華盛頓郵報(bào)》的視頻專訪。

穆拉蒂在接受采訪時(shí)透露，目前利用Sora生成視頻的成本非常高，團(tuán)隊(duì)正在優(yōu)化技術(shù)，預(yù)計(jì)將在今年正式發(fā)布。

穆拉蒂透露，OpenAI人工智能文生視頻大模型Sora即將于今年晚些時(shí)候正式向公眾發(fā)布，OpenAI計(jì)劃最終加入音頻功能，以使場(chǎng)景更為真實(shí)，同時(shí)還將允許用戶編輯Sora生成的視頻內(nèi)容。

除此之外，穆拉蒂還回答了Sora的特別之處、如何修正瑕疵、是否會(huì)包含音頻、訓(xùn)練數(shù)據(jù)來自哪里等若干問題。給出的答案有的籠統(tǒng)，有的不乏誠意。

Sora如何“化文字為神奇”？請(qǐng)你想象一幕場(chǎng)景：“一條美人魚和她的螃蟹伙伴，正在一起瀏覽智能手機(jī)……”

作為這場(chǎng)媒體采訪的“福利”，主持人獲得了讓Sora將其提供的多組文本提示，轉(zhuǎn)化為視頻圖像的機(jī)會(huì)，而以上的這一幕，便是Sora提供的視頻中的一幀。

圖片來源：視頻截圖

Sora究竟是如何實(shí)現(xiàn)這一轉(zhuǎn)換的呢？穆拉蒂表示，盡管解釋美人魚的進(jìn)化可能都要比解釋“擴(kuò)散模型”(diffusion models)的內(nèi)部運(yùn)作容易得多，但簡(jiǎn)而言之便是：人工智能模型分析了大量視頻，學(xué)會(huì)了識(shí)別物體和動(dòng)作。然后，當(dāng)你給它一個(gè)文字提示時(shí)，它就會(huì)勾勒出整個(gè)場(chǎng)景，然后填充每一幀。

在被問及OpenAI為Sora使用了哪些訓(xùn)練數(shù)據(jù)時(shí)，穆拉蒂指出，“我們使用了公開數(shù)據(jù)和授權(quán)數(shù)據(jù)”。

在另外一段視頻里，主持人要求Sora制作一段她更為符合這場(chǎng)采訪的內(nèi)容：“兩位30多歲、有著棕色頭發(fā)的職業(yè)女性，在一個(gè)光線充足的演播室里坐下來接受新聞采訪。”

圖片來源：視頻截圖

最終，在Sora交出的“作業(yè)”里，無論是兩位女性嘴型和頭發(fā)的動(dòng)捕，還是皮夾克上的細(xì)節(jié)，一切看起來都那么真實(shí)。Murati指出，這段20秒的720p分辨率短片，Sora花了幾分鐘才制作完成，但目前還未能支持配備音效。

但穆拉蒂已承諾，他們計(jì)劃最終會(huì)添加聲音。

Murati還表示，當(dāng)前Sora生成視頻的成本遠(yuǎn)高于該公司的圖像生成器Dall-E。不過，在未來向公眾正式發(fā)布時(shí)，OpenAI將進(jìn)行優(yōu)化，以降低對(duì)算力的需求。

北京時(shí)間2月16日，OpenAI發(fā)布文生視頻模型Sora，效果驚艷，引爆全球。此時(shí)距離OpenAI推出ChatGPT，開啟生成式AI時(shí)代，僅僅過去了14個(gè)月時(shí)間，AI的進(jìn)化速度令人震驚。

在Sora生成的視頻里，女士身著黑色皮衣、紅色裙子在霓虹街頭行走，不僅主體連貫穩(wěn)定，還有多鏡頭，包括從大街景慢慢切入到對(duì)女士的臉部表情的特寫，以及潮濕的街道地面反射霓虹燈的光影效果。

YicUhk5aAGtDoBER8LFLgvz8xKobGQbcJT9AzRVsz8VCFpicDelz9Dnsu9cE29dzAs7BP6eWBLwgyhDXCFxiaDTEw.jpg

圖片來源：視頻截圖

Sora的研究結(jié)果表明，擴(kuò)展視頻生成模型是構(gòu)建物理世界通用模擬器一條極具前景的途徑，它使人工智能理解和模擬運(yùn)動(dòng)中的物理世界邁向了一個(gè)新的高度。

有業(yè)內(nèi)人士預(yù)言，通用人工智能（AGI）將比預(yù)期更早到來，產(chǎn)業(yè)差距將拉大。此外，文生視頻所帶來的顛覆性影響引發(fā)了人們的擔(dān)憂，亦有遠(yuǎn)慮者就真實(shí)與虛擬間模糊的邊界反復(fù)預(yù)警。但少有爭(zhēng)議的一點(diǎn)是，Sora被認(rèn)為有望推動(dòng)AI應(yīng)用加速落地。

與此同時(shí)，Sora的誕生引發(fā)了人們對(duì)于AI未來發(fā)展的更多展望。隨著技術(shù)的不斷進(jìn)步，AI將在更多領(lǐng)域發(fā)揮更大的作用。無論是工業(yè)生產(chǎn)、教育培訓(xùn)還是娛樂休閑等領(lǐng)域，AI都將為人類帶來更多的驚喜和可能性。

2月16日，360創(chuàng)始人周鴻祎發(fā)布微博提到自己對(duì)Sora的看法，周鴻祎認(rèn)為，Sora的誕生意味著AGI（通用人工智能）實(shí)現(xiàn)可能從10年縮短至一兩年。

談到Sora最大的優(yōu)勢(shì)，周鴻祎表示，以往文生視頻軟件都是在2D平面上對(duì)圖形元素進(jìn)行操作，可以把視頻看成是多個(gè)真實(shí)圖片的組合，并沒有真正掌握這個(gè)世界的知識(shí)。但Sora產(chǎn)生的視頻里，它能像人一樣理解坦克是有巨大沖擊力的，坦克能撞毀汽車，而不會(huì)出現(xiàn)汽車撞毀坦克這樣的情況，“這次OpenAI利用它的大語言模型優(yōu)勢(shì)，讓Sora實(shí)現(xiàn)了對(duì)現(xiàn)實(shí)世界的理解和對(duì)世界的模擬兩層能力，這樣產(chǎn)生的視頻才是真實(shí)的，才能跳出2D的范圍模擬真實(shí)的物理世界。”

周鴻祎提到，有了大模型技術(shù)作為基礎(chǔ)，再加上人類知識(shí)的引導(dǎo)，可以創(chuàng)造各個(gè)領(lǐng)域的超級(jí)工具，例如在生物醫(yī)學(xué)、蛋白質(zhì)、基因研究，包括物理、化學(xué)、數(shù)學(xué)的學(xué)科研究上，大模型都會(huì)發(fā)揮作用。

“一旦人工智能接上攝像頭，把所有的電影都看一遍，把YouTube上和TikTok的視頻都看一遍，對(duì)世界的理解將遠(yuǎn)遠(yuǎn)超過文字學(xué)習(xí)，一幅圖勝過千言萬語，這就離AGI真的就不遠(yuǎn)了，不是10年20年的問題，可能一兩年很快就可以實(shí)現(xiàn)。”周鴻祎感慨。

每日經(jīng)濟(jì)新聞綜合OpenAI官網(wǎng)、每日經(jīng)濟(jì)新聞、公開資料

封面圖片來源：：視覺中國

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

OpenAI似乎已經(jīng)在為Sora降世預(yù)熱了。當(dāng)?shù)貢r(shí)間3月13日周三，OpenAI首席技術(shù)官米拉·穆拉蒂（Mira Murati）接受了《華盛頓郵報(bào)》的視頻專訪。穆拉蒂在接受采訪時(shí)透露，目前利用Sora生成視頻的成本非常高，團(tuán)隊(duì)正在優(yōu)化技術(shù)，預(yù)計(jì)將在今年正式發(fā)布。穆拉蒂透露，OpenAI人工智能文生視頻大模型Sora即將于今年晚些時(shí)候正式向公眾發(fā)布，OpenAI計(jì)劃最終加入音頻功能，以使場(chǎng)景更為真實(shí)，同時(shí)還將允許用戶編輯Sora生成的視頻內(nèi)容。除此之外，穆拉蒂還回答了Sora的特別之處、如何修正瑕疵、是否會(huì)包含音頻、訓(xùn)練數(shù)據(jù)來自哪里等若干問題。給出的答案有的籠統(tǒng)，有的不乏誠意。 Sora如何“化文字為神奇”？請(qǐng)你想象一幕場(chǎng)景：“一條美人魚和她的螃蟹伙伴，正在一起瀏覽智能手機(jī)……” 作為這場(chǎng)媒體采訪的“福利”，主持人獲得了讓Sora將其提供的多組文本提示，轉(zhuǎn)化為視頻圖像的機(jī)會(huì)，而以上的這一幕，便是Sora提供的視頻中的一幀。圖片來源：視頻截圖 Sora究竟是如何實(shí)現(xiàn)這一轉(zhuǎn)換的呢？穆拉蒂表示，盡管解釋美人魚的進(jìn)化可能都要比解釋“擴(kuò)散模型”(diffusion models)的內(nèi)部運(yùn)作容易得多，但簡(jiǎn)而言之便是：人工智能模型分析了大量視頻，學(xué)會(huì)了識(shí)別物體和動(dòng)作。然后，當(dāng)你給它一個(gè)文字提示時(shí)，它就會(huì)勾勒出整個(gè)場(chǎng)景，然后填充每一幀。在被問及OpenAI為Sora使用了哪些訓(xùn)練數(shù)據(jù)時(shí)，穆拉蒂指出，“我們使用了公開數(shù)據(jù)和授權(quán)數(shù)據(jù)”。在另外一段視頻里，主持人要求Sora制作一段她更為符合這場(chǎng)采訪的內(nèi)容：“兩位30多歲、有著棕色頭發(fā)的職業(yè)女性，在一個(gè)光線充足的演播室里坐下來接受新聞采訪?！? 圖片來源：視頻截圖最終，在Sora交出的“作業(yè)”里，無論是兩位女性嘴型和頭發(fā)的動(dòng)捕，還是皮夾克上的細(xì)節(jié)，一切看起來都那么真實(shí)。Murati指出，這段20秒的720p分辨率短片，Sora花了幾分鐘才制作完成，但目前還未能支持配備音效。但穆拉蒂已承諾，他們計(jì)劃最終會(huì)添加聲音。 Murati還表示，當(dāng)前Sora生成視頻的成本遠(yuǎn)高于該公司的圖像生成器Dall-E。不過，在未來向公眾正式發(fā)布時(shí)，OpenAI將進(jìn)行優(yōu)化，以降低對(duì)算力的需求。北京時(shí)間2月16日，OpenAI發(fā)布文生視頻模型Sora，效果驚艷，引爆全球。此時(shí)距離OpenAI推出ChatGPT，開啟生成式AI時(shí)代，僅僅過去了14個(gè)月時(shí)間，AI的進(jìn)化速度令人震驚。在Sora生成的視頻里，女士身著黑色皮衣、紅色裙子在霓虹街頭行走，不僅主體連貫穩(wěn)定，還有多鏡頭，包括從大街景慢慢切入到對(duì)女士的臉部表情的特寫，以及潮濕的街道地面反射霓虹燈的光影效果。圖片來源：視頻截圖 Sora的研究結(jié)果表明，擴(kuò)展視頻生成模型是構(gòu)建物理世界通用模擬器一條極具前景的途徑，它使人工智能理解和模擬運(yùn)動(dòng)中的物理世界邁向了一個(gè)新的高度。有業(yè)內(nèi)人士預(yù)言，通用人工智能（AGI）將比預(yù)期更早到來，產(chǎn)業(yè)差距將拉大。此外，文生視頻所帶來的顛覆性影響引發(fā)了人們的擔(dān)憂，亦有遠(yuǎn)慮者就真實(shí)與虛擬間模糊的邊界反復(fù)預(yù)警。但少有爭(zhēng)議的一點(diǎn)是，Sora被認(rèn)為有望推動(dòng)AI應(yīng)用加速落地。與此同時(shí)，Sora的誕生引發(fā)了人們對(duì)于AI未來發(fā)展的更多展望。隨著技術(shù)的不斷進(jìn)步，AI將在更多領(lǐng)域發(fā)揮更大的作用。無論是工業(yè)生產(chǎn)、教育培訓(xùn)還是娛樂休閑等領(lǐng)域，AI都將為人類帶來更多的驚喜和可能性。 2月16日，360創(chuàng)始人周鴻祎發(fā)布微博提到自己對(duì)Sora的看法，周鴻祎認(rèn)為，Sora的誕生意味著AGI（通用人工智能）實(shí)現(xiàn)可能從10年縮短至一兩年。談到Sora最大的優(yōu)勢(shì)，周鴻祎表示，以往文生視頻軟件都是在2D平面上對(duì)圖形元素進(jìn)行操作，可以把視頻看成是多個(gè)真實(shí)圖片的組合，并沒有真正掌握這個(gè)世界的知識(shí)。但Sora產(chǎn)生的視頻里，它能像人一樣理解坦克是有巨大沖擊力的，坦克能撞毀汽車，而不會(huì)出現(xiàn)汽車撞毀坦克這樣的情況，“這次OpenAI利用它的大語言模型優(yōu)勢(shì)，讓Sora實(shí)現(xiàn)了對(duì)現(xiàn)實(shí)世界的理解和對(duì)世界的模擬兩層能力，這樣產(chǎn)生的視頻才是真實(shí)的，才能跳出2D的范圍模擬真實(shí)的物理世界。” 周鴻祎提到，有了大模型技術(shù)作為基礎(chǔ)，再加上人類知識(shí)的引導(dǎo)，可以創(chuàng)造各個(gè)領(lǐng)域的超級(jí)工具，例如在生物醫(yī)學(xué)、蛋白質(zhì)、基因研究，包括物理、化學(xué)、數(shù)學(xué)的學(xué)科研究上，大模型都會(huì)發(fā)揮作用。 “一旦人工智能接上攝像頭，把所有的電影都看一遍，把YouTube上和TikTok的視頻都看一遍，對(duì)世界的理解將遠(yuǎn)遠(yuǎn)超過文字學(xué)習(xí)，一幅圖勝過千言萬語，這就離AGI真的就不遠(yuǎn)了，不是10年20年的問題，可能一兩年很快就可以實(shí)現(xiàn)。”周鴻祎感慨。每日經(jīng)濟(jì)新聞綜合OpenAI官網(wǎng)、每日經(jīng)濟(jì)新聞、公開資料

Sora 視頻 Ai OpenAI

上一篇文章

低空經(jīng)濟(jì)概念反復(fù)活躍永悅科技4連板

返回每經(jīng)網(wǎng)首頁

下一篇文章

滬指率先翻紅，稀土永磁、工業(yè)金屬、低空經(jīng)濟(jì)概念股表現(xiàn)出色

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2025 每日經(jīng)濟(jì)新聞報(bào)社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會(huì)征信網(wǎng)

兒童色情信息舉報(bào)專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

四川省互聯(lián)網(wǎng)舉報(bào)中心

中國互聯(lián)網(wǎng)舉報(bào)中心

每日經(jīng)濟(jì)新聞互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號(hào)：蜀ICP備19004508號(hào)-3 川公網(wǎng)安備 51019002002026號(hào)

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人在线免费