RM新时代是什么平台,RM新时代是什么平台

Sora，自2月16日OpenAI發(fā)布后一直被吐槽是“技術(shù)期貨”，終于在12月10日，正式版Sora露面了，可以生成最高 1080p 分辨率、最長 20 秒的視頻。

OpenAI CEO奧特曼稱，Sora正式版是視頻生成領(lǐng)域的GPT-1時刻。

但國內(nèi)AI企業(yè)，并沒有像跟進(jìn)GPT時期一樣，在視頻生成領(lǐng)域也與OpenAI保持同步，而是呈現(xiàn)出更復(fù)雜的態(tài)度。

有人選擇跟進(jìn)，比如Sora問世之后，互聯(lián)網(wǎng)公司如阿里、字節(jié)跳動、快手、騰訊等，AI公司如智譜AI、MiniMax、愛詩科技、生數(shù)科技等，都陸續(xù)發(fā)布了視頻生成模型，不少都表示達(dá)到或超越了預(yù)覽版Sora。

也有人選擇不跟進(jìn)，包括互聯(lián)網(wǎng)公司中的百度，李彥宏曾明確表示，“無論Sora多么火爆百度都不去做”。AI公司如百川智能，也明確表示不會做類Sora模型，月之暗面、商湯科技、零一萬物雖然都有文生視頻模型，但都不作為重點(diǎn)。

視頻生成賽道，不再延續(xù)GPT時代的發(fā)展模式，即OpenAI打出一張王牌，國內(nèi)科技企業(yè)搶著要跟。Sora之后，國內(nèi)AI牌局開始有了自己的節(jié)奏，也呈現(xiàn)出更為復(fù)雜的局勢。

有能力做通用基礎(chǔ)大模型的國內(nèi)科技公司，在技術(shù)路線、商業(yè)前景等判斷上，開始出現(xiàn)明顯分野。我們就從國內(nèi)企業(yè)跟進(jìn)Sora的選擇與否，聊聊視頻生成的中國牌局。

首先我們要明確一下，國內(nèi)對標(biāo)Sora模型的科技公司，到底在做什么？

簡單來說，Sora視頻生成模型的核心技術(shù)路線是Diffusion+Transformer相結(jié)合，通過文本（自然語言）、圖片、視頻作為提示詞prompts進(jìn)行視頻生成。

對標(biāo)Sora的模型，至少要具備幾個特點(diǎn)：

1.通用性，不針對某一類風(fēng)格、行業(yè)、角色等，任意內(nèi)容的視頻都可以生成。

2.高質(zhì)量，畫質(zhì)精度高（達(dá)到1080p）、視頻時間長（最長達(dá)一分鐘）、畫面一致性強(qiáng)（理解物理規(guī)律）。

面對Sora，國內(nèi)科技企業(yè)不像ChatGPT推出時那樣毫無準(zhǔn)備。但到底跟or不跟，卻不再像ChatGPT那樣高度一致，而是分化成了三類：

第一類，明確跟進(jìn)。

互聯(lián)網(wǎng)公司陣營中，以視頻為核心業(yè)務(wù)的字節(jié)跳動、快手等，以及綜合科技公司騰訊，數(shù)字基建成熟，技術(shù)人才資源充沛，內(nèi)部有視頻產(chǎn)品基因，幾乎第一時間選擇了跟進(jìn)。字節(jié)跳動推出了即夢Dreamnia，快手也發(fā)布了可靈大模型。騰訊以混元大模型作為核心，發(fā)布并開源了混元多模態(tài)生成模型，被認(rèn)為是騰訊版Sora。

大模型初創(chuàng)企業(yè)中，智譜AI的行動最為敏捷，今年7月發(fā)布了AI視頻生成工具清影，支持用戶通過文本/圖片，生成10秒、4K、60幀視頻。MiniMax的海螺AI也在十月增加了視頻生成能力，支持文本提示詞生成6秒視頻片段。

第二類，堅(jiān)決不跟。

與第一類企業(yè)的態(tài)度截然相反，互聯(lián)網(wǎng)公司和大模型創(chuàng)企中也有堅(jiān)決不跟Sora的。比如Sora問世之后，百川智能的王小川就表示，團(tuán)隊(duì)有人提出要做Sora，但他明確表態(tài)稱不會跟進(jìn)這個方向。

同樣想法的還有百度李彥宏，盡管百度已經(jīng)在視頻生成領(lǐng)域取得了一定的成果，但他不做Sora的態(tài)度也非常堅(jiān)決，原因是Sora的商業(yè)化可能要五年甚至十年，目前百度更聚焦在大語言模型、多模態(tài)大模型，沒有類Sora的產(chǎn)品化嘗試。

第三類，淺嘗輒止。

除此之外，還有大量國內(nèi)企業(yè)對于Sora，出于FOMO“恐懼錯過”心理有所布局，但并不重點(diǎn)投入，處于一種淺嘗輒止的狀態(tài)。

比如阿里系中的阿里媽媽團(tuán)隊(duì)發(fā)布了tomoVideo，試水電商營銷的視頻生成場景；“大模型六小虎”中，月之暗面也推出了視頻生成模型，但仍聚焦在kimi產(chǎn)品上；零一萬物入局B端業(yè)務(wù)，而視頻生成模型面向的影視制作行業(yè)正處于調(diào)整期，類Sora產(chǎn)品也很難成為核心增長點(diǎn)。

總結(jié)一下，如果說全球大模型是一場“斗地主”，那么游戲規(guī)則不再是OpenAI打出一張王炸，國內(nèi)科技公司紛紛跟上，而是各自按照自己手里的牌面、業(yè)務(wù)重要性和優(yōu)先級，來確定Sora的出牌策略。

為什么到了Sora，大模型行業(yè)的游戲規(guī)則就變了？

國內(nèi)科技企業(yè)的表現(xiàn)說明，對于Sora存在非共識，整體還是比較混亂、規(guī)則模糊的階段。迷霧中的領(lǐng)域，游戲規(guī)則自然只能自行探索。

如今視頻生成領(lǐng)域的現(xiàn)狀，籠罩著三重迷霧。

技術(shù)迷霧：OpenAl認(rèn)為Sora是世界模擬器、通往AGl的一條有前途的途徑，這一技術(shù)路線目前存在不少爭議。

比如李飛飛、lecun等人認(rèn)為，Sora不能實(shí)現(xiàn)AGI。李飛飛提出，Sora仍是二維圖像，只有三維空間智能才能實(shí)現(xiàn)AGI。Sora預(yù)覽版展示的“日本女性走過霓虹閃爍東京街頭”的生成視頻，就無法把攝像機(jī)放在女子背后，說明Sora并沒有真的理解三維世界。學(xué)術(shù)大神Lecun也點(diǎn)名不看好Sora，說它根本不是真正的世界模型，并且仍會面臨GPT4的巨大瓶頸。

確實(shí)，即使是正式版Sora，生成的手部細(xì)節(jié)不準(zhǔn)確，動態(tài)過程中的一致性等問題，依然存在。

而國內(nèi)公司堅(jiān)定不跟進(jìn)Sora的原因之一，也是對這一技術(shù)路線保留意見。比如百川智能的王小川就認(rèn)為，Sora只是階段性產(chǎn)物，技術(shù)高度、突破性以及應(yīng)用價值均不及GPT。總之，實(shí)現(xiàn)AGI、模擬物理世界的技術(shù)路線的開放性，決定了Sora并非唯一解。

商業(yè)迷霧：視頻生成模型的商用前景、投資回報(bào)比，在短期內(nèi)都不明朗，成為勸退國內(nèi)企業(yè)的另一重阻礙。

預(yù)覽版和正式版Sora，都延續(xù)了OpenAI的“暴力美學(xué)”，OpenAI 研究科學(xué)家 Noam Brown 表示，Sora是scale力量最直觀的展示，也就是通過堆算力、對數(shù)據(jù)、對參數(shù)量的方式，來嘗試讓大模型涌現(xiàn)出理解物理世界的能力。這種方法成本高、資源投入大。是否跟進(jìn)Sora，就取決于各家對模型的商用預(yù)期和投資回報(bào)比。

如果視頻生成模型面向ToB收費(fèi)，通過API或SaaS服務(wù)，都需要基礎(chǔ)模型廠商投入大量人力去優(yōu)化業(yè)務(wù)流程、開發(fā)交互頁面，而影視行業(yè)正處于調(diào)整周期，AI影視制作業(yè)務(wù)的增長有限。這就在無形中增加了AI企業(yè)的機(jī)會成本，因?yàn)橥瑯拥娜肆Α⑽锪?、算力，投入到金融AI、教育AI、大型政企等領(lǐng)域，顯然收效更大。所以，百度、零一萬物等公司，都將視頻生成領(lǐng)域作為邊緣業(yè)務(wù)，并不重點(diǎn)投入。

而ToC場景中，一方面?zhèn)€人付費(fèi)意愿不高，視頻生成并不是大眾日常使用的高頻場景，而且生成成本和訂閱費(fèi)一般都比文本模型高，加上Sora模型都沒能解決幻覺、一致性難題，未必能創(chuàng)造實(shí)際價值，所以C端付費(fèi)規(guī)模十分有限。另一方面，模型完全免費(fèi)，把視頻生成模型產(chǎn)品作為企業(yè)的流量入口，這一商業(yè)模式只適合將視頻作為核心業(yè)務(wù)的企業(yè)。

比如快手、字節(jié)跳動，本身就有核心的視頻業(yè)務(wù)，可以快速實(shí)現(xiàn)模型的規(guī)模化。面向C端用戶或B端生產(chǎn)力工具，這類企業(yè)能夠快速將視頻生成能力與現(xiàn)有產(chǎn)品進(jìn)行集成與整合，模型研發(fā)的邊際成本是會隨著規(guī)模商用而下降的。

整體來看，對國內(nèi)絕大多數(shù)基礎(chǔ)模廠，視頻生成領(lǐng)域都是一個相對邊緣、投資回報(bào)比不高的業(yè)務(wù)。

第三重迷霧，就是市場格局的競爭迷霧。

雖然視頻生成模型現(xiàn)在商業(yè)前景不明，但有沒有可能以后會爆發(fā)，企業(yè)悄悄投入然后驚艷所有人？這種押注邊緣賽道“撿大漏”的商業(yè)神話，在大模型身上恐怕很難發(fā)生。

當(dāng)前，大模型的產(chǎn)品化、商業(yè)化前景普遍比較模糊，通用模型廠商都需要盡快從一大堆不甚明朗的產(chǎn)品中，選出一個更高成功概率和更大市場潛力的選項(xiàng)，重點(diǎn)投入。而在所有產(chǎn)品中，視頻生成模型是一個尤為沉重且具有挑戰(zhàn)性的項(xiàng)目。這種情況下，肯定要優(yōu)先考慮成功率更高的產(chǎn)品，降低視頻生成模型的業(yè)務(wù)優(yōu)先級。

換一個角度，即便企業(yè)將視頻生成模型的優(yōu)先級放到最高，恐怕也很難建立起競爭優(yōu)勢。因?yàn)楫?dāng)前大模型的市場競爭情況跟GPT時期不太一樣，如今各家在基礎(chǔ)訓(xùn)練設(shè)施、核心架構(gòu)設(shè)計(jì)與技術(shù)儲備等方面都有了一定積累，復(fù)現(xiàn)Sora并上線類Sora應(yīng)用的技術(shù)壁壘，其實(shí)沒有ChatGPT時期那么難了。這也意味著，即使企業(yè)先發(fā)布了視頻生成模型，也未必能長期保持競爭優(yōu)勢和市場壟斷地位，這種競爭態(tài)勢也削弱了Sora的商業(yè)想象空間。

技術(shù)迷霧、商業(yè)迷霧、競爭迷霧，仍然籠罩在視頻生成領(lǐng)域，導(dǎo)致Sora這一場牌局有著太多的不確定，和太多可能。哪種理解是對的，哪條路線是最終贏家，目前都言之過早，各家只能按照自己的游戲規(guī)則玩下去。

大模型技術(shù)必須繼續(xù)發(fā)展下去，但從Sora開始，國內(nèi)科技企業(yè)不再緊跟著OpenAI亦步亦趨，開始有了自己的節(jié)奏感。

具體表現(xiàn)在，對于Sora這樣一鳴驚人的新東西，國內(nèi)企業(yè)在大模型產(chǎn)品化、商業(yè)化上都有了自己的理解與思考，開始自己定義玩法，跟進(jìn)Sora展現(xiàn)的是實(shí)力，不跟進(jìn)Sora展現(xiàn)的是心態(tài)與戰(zhàn)略定力。

此外，不一味跟進(jìn)產(chǎn)品，但OpenAI的敘事能力仍然值得學(xué)習(xí)。

無論是2月用Sora搶走谷歌風(fēng)頭，還是近期Sora正式上線，OpenAI總能一次次帶動節(jié)奏、設(shè)置議題、吸引關(guān)注，這對于資本密集型AI企業(yè)是非常重要的能力。

可以不跟進(jìn)Sora，但不能遺漏關(guān)鍵技術(shù)。

以百度為例，雖然沒有推出Sora產(chǎn)品的計(jì)劃，但自身也沒有缺席關(guān)鍵技術(shù)，比如自研了多模態(tài)可控生圖技術(shù)，能夠在保持實(shí)體特征不變的情況下，實(shí)現(xiàn)圖像的高泛化生成，而可控性的提升，恰恰是視頻生成下一階段核心中的核心。此外，百度也沒有完全無視視頻生成領(lǐng)域，目前投資了視頻生成初創(chuàng)公司生數(shù)科技、AI視頻短劇公司井英科技等。

聚焦主賽道，以自身核心業(yè)務(wù)、商業(yè)優(yōu)先級等多元因素來確定追趕Sora的輕重緩急。大模型的牌局，國內(nèi)企業(yè)正在找到自己的節(jié)奏感。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
30728

瀏覽量
268873
Sora

Sora

+關(guān)注

關(guān)注
0

文章
81

瀏覽量
195

OpenAI暫不推出Sora視頻生成模型API

OpenAI近日宣布，目前暫無推出其視頻生成模型Sora的應(yīng)用程序接口(API)的計(jì)劃。Sora模型能夠基于文本和圖像

發(fā)表于 12-20 14:23 ?67次閱讀

OpenAI推出AI視頻生成模型Sora

近日，備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布，無疑為AI技術(shù)注入了新的活力。據(jù)悉，Sora與OpenAI旗下的AI工具DALL-E有著

發(fā)表于 12-12 09:40 ?166次閱讀

OpenAI開放Sora視頻生成模型

OpenAI近日宣布，其傾力打造的人工智能視頻生成系統(tǒng)Sora已正式向美國及其他市場的ChatGPT Plus訂閱用戶開放。自去年首次公開預(yù)覽以來，Sora歷經(jīng)約10個月的精心研發(fā)與優(yōu)化，現(xiàn)已全面

發(fā)表于 12-10 11:16 ?304次閱讀

Sora還在PPT階段，“中國版Sora”已經(jīng)開放使用了！

電子發(fā)燒友網(wǎng)報(bào)道（文/梁浩斌）今年春節(jié)期間，OpenAI的AI文字生成視頻模型Sora驚艷全世界，極高的視頻生成效果、長達(dá)60秒的

發(fā)表于 06-17 09:07 ?3399次閱讀

新火種AI|圍攻光明頂：Sora效應(yīng)下的AI視頻生成競賽

Sora的出現(xiàn)，讓AI視頻生成領(lǐng)域真正“活”了起來

發(fā)表于 03-16 11:12 ?636次閱讀

除了刷屏的Sora，國內(nèi)外還有哪些AI視頻生成工具

。Sora的發(fā)布也讓AI生成視頻有了突破性進(jìn)展。 ? 過去一年多，全球科技公司都在發(fā)布各種大模型，然而AI生成內(nèi)容更多集中在文本和圖片方面，

發(fā)表于 02-26 08:42 ?4343次閱讀

除了刷屏的<b class='flag-5'>Sora</b>，國內(nèi)外還有哪些AI<b class='flag-5'>視頻生成</b>工具

sora模型怎么使用 sora模型對現(xiàn)實(shí)的影響

美國當(dāng)?shù)貢r間2024年2月15日，OpenAI正式發(fā)布文生視頻模型Sora ，并發(fā)布了48個文生視頻案例和技術(shù)報(bào)告，正式入局視頻生成領(lǐng)域

發(fā)表于 02-22 16:42 ?1167次閱讀

OpenAI文生視頻模型Sora要點(diǎn)分析

近日，美國人工智能公司OpenAI發(fā)布了首個視頻生成模型Sora。不同于此前許多AI大模型文生圖或視頻時，會出現(xiàn)人物形象前后不一致等問題

發(fā)表于 02-22 16:37 ?1066次閱讀

OpenAI文生<b class='flag-5'>視頻</b><b class='flag-5'>模型</b><b class='flag-5'>Sora</b>要點(diǎn)分析

OpenAI 在 AI 生成視頻領(lǐng)域扔出一枚“王炸”，視頻生成模型“Sora”

ABSTRACT摘要2月16日凌晨，也就是中國大年初七，OpenAI在AI生成視頻領(lǐng)域扔出一枚“王炸”，宣布推出全新的生成式人工智能模型“

發(fā)表于 02-22 08:25 ?384次閱讀

OpenAI 在 AI <b class='flag-5'>生成</b><b class='flag-5'>視頻</b>領(lǐng)域扔出一枚“王炸”，<b class='flag-5'>視頻生成</b><b class='flag-5'>模型</b>“<b class='flag-5'>Sora</b>”

openai發(fā)布首個視頻生成模型sora

發(fā)表于 02-21 16:45 ?1255次閱讀

馬斯克稱特斯拉視頻生成技術(shù)超過Sora

特斯拉CEO埃隆·馬斯克在社交媒體平臺上發(fā)表言論，聲稱特斯拉所掌握的視頻生成技術(shù)超越了OpenAI最新發(fā)布的Sora模型。馬斯克自信地表示，特斯拉在這一領(lǐng)域的技術(shù)實(shí)力堪稱全球頂尖，甚至超越了OpenAI這一人工智能領(lǐng)域的佼佼者。

發(fā)表于 02-20 14:16 ?609次閱讀

OpenAI發(fā)布Sora模型，瞬間生成高清大片

近日，人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI發(fā)布了一款名為“Sora”的視頻生成AI模型，再次展示了其在AI技術(shù)領(lǐng)域的創(chuàng)新實(shí)力。Sora以其出色的視頻生

發(fā)表于 02-20 13:33 ?806次閱讀

OpenAI新年開出王炸，視頻生成模型Sora問世

近日，OpenAI在AI生成視頻領(lǐng)域取得重大突破，發(fā)布了全新的生成式人工智能模型“Sora”。該模型

發(fā)表于 02-20 11:46 ?795次閱讀

OpenAI發(fā)布文生視頻模型Sora，引領(lǐng)AI視頻生成新紀(jì)元

在人工智能(AI)領(lǐng)域掀起新一輪革命浪潮的，正是OpenAI最新推出的文生視頻大模型——Sora。這款被業(yè)界廣泛贊譽(yù)的模型，以其“逼真”和“富有想象力”的

發(fā)表于 02-19 11:03 ?938次閱讀

OpenAI發(fā)布首個視頻生成模型Sora

OpenAI近日宣布推出其全新的文本到視頻生成模型——Sora。這一突破性的技術(shù)將視頻創(chuàng)作帶入了一個全新的紀(jì)元，為用戶提供了前所未有的創(chuàng)作可能性。

發(fā)表于 02-18 10:07 ?1053次閱讀

RM新时代网站-首页

搜索歷史

Sora之后，視頻生成模型的中國牌局

評論