每日經(jīng)濟新聞

要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

如何在AI賦能中平衡創(chuàng)新與挑戰(zhàn)？巢文涵：從訓練和創(chuàng)造AI走向調用和激發(fā)AI潛力

每日經(jīng)濟新聞 2024-03-17 19:28:00

◎3月15日，由工業(yè)和信息化部工業(yè)文化發(fā)展中心牽頭成立的AI應用工作組主辦，每日經(jīng)濟新聞承辦、數(shù)智未來場景實驗室協(xié)辦的“Sora的啟示：AI應用再飛躍”主題沙龍活動在京成功舉辦。北京航空航天大學計算機學院副教授巢文涵在主旨演講環(huán)節(jié)談道：想要在生成式AI的應用中尋求進一步突破，應該從訓練和創(chuàng)造AI，逐漸走向調用和激發(fā)AI潛力。

每經(jīng)記者王郁彪每經(jīng)編輯文多

北京航空航天大學計算機學院副教授巢文涵進行主旨演講圖片來源：每經(jīng)記者韓陽攝

AI大潮洶涌，真實與虛擬，正在被無限模糊。2024開年，OpenAI用它的首個視頻生成模型Sora宣告了一個AI新階段的到來——僅憑簡單的文字描述，便可深度模擬真實物理世界，生成最長60秒的擬真視頻。

如果把AI比作剛出生的嬰兒，大語言模型的誕生則意味著它開口講話，Sora的面世相當于他/她睜開了雙眼，并把自己觀察到的一切轉化為畫面與聲音。

隨著AI技術的不斷發(fā)展與應用，在AI賦能的過程中，該如何平衡其中的創(chuàng)新與挑戰(zhàn)？

3月15日，由工業(yè)和信息化部工業(yè)文化發(fā)展中心牽頭成立的AI應用工作組主辦，每日經(jīng)濟新聞承辦、數(shù)智未來場景實驗室協(xié)辦的“Sora的啟示：AI應用再飛躍”主題沙龍活動在京成功舉辦。

北京航空航天大學計算機學院副教授巢文涵在主旨演講環(huán)節(jié)表示：生成式AI的迭代速度降低了用戶端的再訓練必要性，因此，想要在生成式AI的應用中尋求進一步突破，應該從訓練和創(chuàng)造AI，逐漸走向調用和激發(fā)AI潛力。

重新認識Sora——“世界模擬器”

當其他AI視頻工具還在突破幾秒內的連貫性時，Sora已經(jīng)可以快速制作最長1分鐘、準確反映用戶提示、可一鏡到底的視頻。

對于Sora在技術上的突破，巢文涵認為，Sora實際上是一個“Diffusion＋Transformer模型”（Diffusion、Transformer分別為模型名稱），是二者組合成的強大信息提取器。

此外，他還表示，Sora繼承了Dall-E3（OpenAI開發(fā)的最新文本到圖像轉換工具）的畫質和遵循指令的能力，可以深度模擬真實物理世界，能生成具有多個角色、包含特定運動的復雜場景。

因其根據(jù)靜態(tài)圖像生成視頻的能力，Sora在動圖制作、廣告設計等領域具有不小的應用前景。不過，巢文涵還補充說，Sora能夠獲取現(xiàn)有視頻并對其進行擴展或填充缺失的幀，這一功能在視頻編輯、電影特效等領域也將有不俗的應用表現(xiàn)。

值得一提的是，用戶還可以使用Sora連接兩個輸入視頻，在完全不同的主題和場景組成的視頻間，實現(xiàn)無縫過渡。

Sora在技術上的突破及其未來廣闊的應用前景，使得AI又上升到了一個全新的維度。“Sora雖被定義為一款人工智能文生視頻大模型，但其實，OpenAI并未將其單純視為視頻模型，而是作為‘世界模擬器’。”巢文涵如此表示。

北京航空航天大學計算機學院副教授巢文涵圖片來源：每經(jīng)記者韓陽攝

從訓練和創(chuàng)造AI，走向調用和激發(fā)AI潛力

從時尚展示到動漫制作，從心理治療到建筑規(guī)劃，Sora可以為多個相關領域進行全新的創(chuàng)造、再創(chuàng)造。不過，巢文涵認為，Sora同樣擁有諸多局限性。

比如，Sora在處理復雜場景時對物理規(guī)則的應用不一致，因此出現(xiàn)無法準確模擬出因果關系的特定情況。這也可以解釋，為什么在Sora生成的視頻里，時常能看到變形的椅子飛向天空的畫面。

巢文涵進一步補充說，在人機交互、充分理解空間和時間的復雜性以及使用限制上，Sora還有非常多的局限性。

那么，如何在AI技術不斷突破的過程中，繼續(xù)逐點擊破AI賦能和應用的難點，平衡創(chuàng)新與挑戰(zhàn)？巢文涵表示，生成式AI應用，應該從訓練和創(chuàng)造AI，走向調用和激發(fā)AI潛力。

“生成式AI的迭代速度降低了用戶端的再訓練必要性，關鍵是用戶怎么調用這些生成式AI。同時，大模型本身外部檢索、多模態(tài)能力都非常強，本身是一個好的搜索入口。”他接著補充說，“應該進一步去App化，提供更多維度的綜合應用交互方式。”

在巢文涵看來，大模型本身具備生態(tài)插件及融合能力，其自身會調用服務接口，不需要打開App，而是需要設計合理的API（應用程序編程接口）接口。此外，還需打破傳統(tǒng)AI應用中語音、文字、圖片等不同格式內容的界限，提供更多維度的綜合應用交互方式。

從技術層面考量，Sora也面臨著一系列挑戰(zhàn)，包括可擴展性和計算資源、隱私和倫理問題以及就業(yè)和社會變革等。這些挑戰(zhàn)中，巢文涵特別提到了深度偽造。他注意到，不法分子會利用機器的深度學習技術，進行圖像、聲音、視頻的篡改、偽造和自動生成，產(chǎn)生高度逼真且難以甄別的內容。

巢文涵認為，Sora對社會生產(chǎn)力和產(chǎn)業(yè)發(fā)展的促進作用毋庸置疑，但同時，Sora創(chuàng)造的大量虛擬視頻會污染現(xiàn)存的圖像數(shù)據(jù)，引發(fā)一系列問題。

因此，他建議，應該建立法律和監(jiān)管框架，同時提供政策支持，增強創(chuàng)新意識，加強數(shù)據(jù)保護與安全。

如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

Ai Sora 創(chuàng)新

上一篇文章

重磅！驅動來了！下周看這個方向？——道達對話牛博士

返回每經(jīng)網(wǎng)首頁

下一篇文章

國聯(lián)證券發(fā)布福耀玻璃研報，量價齊升驅動全年業(yè)績增長，高分紅持續(xù)回報股東

相關文章

熱文精選

點擊排行

歡迎關注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

相關信息
關于我們
版權聲明

關注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2025 每日經(jīng)濟新聞報社版權所有，未經(jīng)許可不得轉載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡社會征信網(wǎng)

兒童色情信息舉報專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報中心

四川省互聯(lián)網(wǎng)舉報中心

中國互聯(lián)網(wǎng)舉報中心

每日經(jīng)濟新聞互聯(lián)網(wǎng)不良與違法信息舉報中心

互聯(lián)網(wǎng)新聞信息服務許可證：51120190017 網(wǎng)站備案號：蜀ICP備19004508號-3 川公網(wǎng)安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人在线免费