每日經(jīng)濟新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

挑戰(zhàn)OpenAI,谷歌新動作!大幅更新生成式AI,推出視頻模型VEO 2和最新版Imagen3

每日經(jīng)濟新聞 2024-12-17 07:46:41

谷歌的旗艦AI研究實驗室Google DeepMind周一大幅升級其人工智能驅(qū)動的內(nèi)容生成工具,推出了Veo 2視頻生成模型和增強版Imagen 3圖像模型,挑戰(zhàn)OpenAI在AI圖像和視頻生成的領(lǐng)先地位。谷歌表示,這些更新有望徹底改變創(chuàng)意工作流程,為視頻和圖像創(chuàng)作者提供更高的真實感和定制化體驗。

每經(jīng)編輯 畢陸名

谷歌(GOOGL,股價196.66美元,市值24073億美元)的旗艦AI研究實驗室Google DeepMind周一大幅升級其人工智能驅(qū)動的內(nèi)容生成工具,推出了Veo 2視頻生成模型和增強版Imagen 3圖像模型,挑戰(zhàn)OpenAI在AI圖像和視頻生成的領(lǐng)先地位。谷歌表示,這些更新有望徹底改變創(chuàng)意工作流程,為視頻和圖像創(chuàng)作者提供更高的真實感和定制化體驗。

谷歌介紹,Veo 2是谷歌的視頻生成工具,能夠生成多樣化主題和風格的高質(zhì)量視頻。谷歌在博客中表示,這款模型在真實感方面表現(xiàn)卓越,能夠捕捉到人類表情和電影效果等細節(jié)。其增強的物理和電影學理解能力使用戶能夠生成令人驚嘆的內(nèi)容,包括跟蹤鏡頭和廣角構(gòu)圖等。

圖片來源:視覺中國

例如,Veo 2熟悉電影拍攝語言,用戶可以要求某種類型的風格,指定鏡頭,建議電影效果,Veo 2都會以高達4K分辨率并延長到數(shù)分鐘的視頻長度來呈現(xiàn)。值得注意的是,這一分辨率是OpenAI Sora模型的4倍,視頻時長更是其6倍以上。

不過,目前這些優(yōu)勢仍是理論上的。在谷歌的實驗性視頻創(chuàng)作工具VideoFX中,Veo 2生成的視頻被限制為720p分辨率、8秒的長度。(相比之下,Sora的最大輸出為1080p、20秒的短片。)

谷歌表示,雖然視頻生成模型往往會“幻象化”出不需要的細節(jié),例如多余的手指或意外的物體,但Veo 2在這一方面的表現(xiàn)更為真實,生成錯誤的頻率較低。此外,Veo 2生成的視頻包括不可見的SynthID水印,用于標記它們?yōu)锳I生成的內(nèi)容,從而減少誤用或錯誤歸屬的風險。

DeepMind產(chǎn)品副總裁Eli Collins對媒體表示,隨著模型逐漸具備規(guī)?;褂玫臏蕚洌雀鑼⑼ㄟ^其Vertex AI開發(fā)者平臺提供Veo 2。

開發(fā)者和創(chuàng)作者目前可以通過谷歌實驗室(Google Labs)訪問該工具,預(yù)計到2025年,它將廣泛集成至諸如YouTube Shorts等平臺。同時,Imagen 3模型在圖像構(gòu)圖和細節(jié)準確性方面得到了增強,支持從寫實到抽象的各種風格,能夠生成更豐富的紋理,并更加忠實地回應(yīng)用戶提示。

目前,Imagen 3已經(jīng)通過谷歌實驗室的ImageFX工具在100多個國家上線,全球用戶可以試驗其尖端功能。

此外,谷歌還推出了Whisk,這是一款結(jié)合了Imagen 3和Gemini視覺分析能力的創(chuàng)意工具。用戶可以輸入圖像,生成詳細的文字描述、重新混合風格,或設(shè)計個性化作品,如數(shù)字玩偶或搪瓷徽章。

谷歌介紹,Whisk結(jié)合了Imagen 3模型和Gemini的視覺理解與描述能力。Gemini模型會自動為用戶的圖像生成詳細的文字描述,并將這些描述傳遞給Imagen 3。這一過程讓用戶能夠以有趣的新方式重新混合主題、場景和風格。

圖片來源:谷歌官網(wǎng)截圖

北京時間12月10日,谷歌宣布研發(fā)出新的量子芯片Willow(威洛)。這款計算能力超強的芯片,實現(xiàn)了量子計算領(lǐng)域30年來的關(guān)鍵性突破,5分鐘即可完成當今計算機要10堯(10的25次方)年才能完成的任務(wù)。研究成果發(fā)表在12月9日出版的《nature》雜志上。

消息傳出后,量子信息行業(yè)一片歡呼,AI圈也大受震撼。

Willow的重大突破表現(xiàn)在兩個方面:一是性能也就是計算能力的大幅飛升。5分鐘計算量相當于目前運行速度最快的計算機10堯(10的25次方)年才能完成的任務(wù)。10²年遠高于宇宙的年齡(約130億年)。5分鐘與10²年,這個對比,可見其計算速度的躍升非常之恐怖。

二是強大的量子糾錯能力。Willow在量子糾錯領(lǐng)域?qū)崿F(xiàn)的重大進展是,基于可擴展的方形網(wǎng)格,邏輯量子比特數(shù)量(目前是105個量子比特)增加,錯誤率卻迅速下降。其從3x3編碼量子位擴展到5x5的網(wǎng)格,再擴展到7x7的網(wǎng)格,每次擴展,錯誤率減半。而且Willow可實時糾錯,這使其在短時間內(nèi)擴展到更高位階的量子比特(比如1050個)成為可能。

以上兩項重大突破,相比性能提升,糾錯能力更受科學家關(guān)注。

量子芯片是量子計算機的核心。Willow的研發(fā)團隊是哈特穆特·內(nèi)文(Hartmut Neven)領(lǐng)導(dǎo)的谷歌量子AI實驗室。哈特穆特表示,Willow是向大規(guī)模、自糾錯量子計算機邁出的一大步,它的糾錯能力和超越經(jīng)典的計算能力使我們更接近一個可提供商業(yè)應(yīng)用的系統(tǒng),從幫助發(fā)現(xiàn)新藥,到設(shè)計更高效的電動汽車電池,再到加速核聚變和新能源替代的進展。

每日經(jīng)濟新聞綜合谷歌、公開信息

免責聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請核實。據(jù)此操作,風險自擔。

封面圖片來源:每日經(jīng)濟新聞

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

谷歌 視頻 Ai VE

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人 在线 免费