ABSTRACT摘要
2 月 16 日凌晨,也就是中國(guó)大年初七,OpenAI 在 AI 生成視頻領(lǐng)域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。
這家舊金山公司周四推出的該工具使用生成人工智能,根據(jù)書(shū)面命令立即創(chuàng)建短視頻。
JAEALOT
2024年2月16日
2 月 16 日凌晨,也就是中國(guó)大年初七,OpenAI 在 AI 生成視頻領(lǐng)域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。
這家舊金山公司周四推出的該工具使用生成人工智能,根據(jù)書(shū)面命令立即創(chuàng)建短視頻。
Sora 并不是第一個(gè)展示這種技術(shù)的產(chǎn)品。但行業(yè)分析師指出,該工具迄今為止展示的視頻質(zhì)量很高,并指出它的推出標(biāo)志著 OpenAI 和文本到視頻生成的未來(lái)的整體重大飛躍。
盡管如此,與當(dāng)今快速發(fā)展的人工智能領(lǐng)域的所有事物一樣,此類(lèi)技術(shù)也引發(fā)了人們對(duì)潛在道德和社會(huì)影響的擔(dān)憂(yōu)。
Sora 是一款文本到視頻生成器 - 使用生成式 AI 根據(jù)書(shū)面提示創(chuàng)建長(zhǎng)達(dá) 60 秒的視頻。該模型還可以從現(xiàn)有的靜態(tài)圖像生成視頻。
生成式人工智能是人工智能的一個(gè)分支,可以創(chuàng)造新的東西。示例包括聊天機(jī)器人(如 OpenAI 的 ChatGPT)以及圖像生成器(如 DALL-E 和 Midjourney)。讓人工智能系統(tǒng)生成視頻是更新且更具挑戰(zhàn)性的,但依賴(lài)于一些相同的技術(shù)。
OpenAI 在周四(2 月 15 日)的博客文章中表示, Sora可以根據(jù)用戶(hù)的文本提示創(chuàng)建長(zhǎng)達(dá)一分鐘的視頻。
OpenAI 在帖子中表示:“我們正在教人工智能理解和模擬運(yùn)動(dòng)中的物理世界,目的是訓(xùn)練模型來(lái)幫助人們解決需要現(xiàn)實(shí)世界交互的問(wèn)題。”
OpenAI 在帖子中補(bǔ)充道:“Sora 能夠生成具有多個(gè)角色、特定類(lèi)型的運(yùn)動(dòng)以及主題和背景的準(zhǔn)確細(xì)節(jié)的復(fù)雜場(chǎng)景。” “該模型不僅了解用戶(hù)在提示中提出的要求,還了解這些東西在物理世界中的存在方式?!?/p>
此外,根據(jù)該帖子,生成式人工智能模型可以基于單個(gè)圖像創(chuàng)建視頻,以及擴(kuò)展現(xiàn)有視頻或填充缺失的幀。
Sora 尚未可供公眾使用(OpenAI 表示,在正式發(fā)布該工具之前,它正在與政策制定者和藝術(shù)家進(jìn)行接觸),而且還有很多我們不知道的事情。但自周四宣布以來(lái),該公司已經(jīng)分享了一些 Sora 生成的視頻示例,以展示其功能。
OpenAI 首席執(zhí)行官 Sam Altman 還利用 X(以前稱(chēng)為T(mén)witter 的平臺(tái))要求社交媒體用戶(hù)及時(shí)發(fā)送想法。后來(lái),他分享了逼真詳細(xì)的視頻,這些視頻響應(yīng)了“兩只金毛獵犬在山頂上播客”和“在海洋上與不同動(dòng)物進(jìn)行自行車(chē)比賽,運(yùn)動(dòng)員在無(wú)人機(jī)攝像機(jī)視圖下騎自行車(chē)”等提示。
雖然 Sora 生成的視頻可以描繪復(fù)雜、極其詳細(xì)的場(chǎng)景,但 OpenAI 指出仍然存在一些弱點(diǎn),包括一些空間和因果元素。例如,OpenAI 在其網(wǎng)站上補(bǔ)充道,“一個(gè)人可能會(huì)咬一口餅干,但之后,餅干可能沒(méi)有咬痕?!?/p>
OpenAI 的 Sora 并不是同類(lèi)產(chǎn)品中的第一個(gè)。谷歌、Meta 和初創(chuàng)公司 Runway ML 等公司都展示了類(lèi)似的技術(shù)。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28379瀏覽量
206912 -
AI
+關(guān)注
關(guān)注
87文章
30728瀏覽量
268880 -
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238235
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論