訂閱
糾錯
加入自媒體

從Sora2到蒸汽機(jī)2:被引爆的AI視頻全球競速

翼言商業(yè)觀察

“AI視頻生成領(lǐng)域,一定會誕生一個超級應(yīng)用。”

10月以來,AI視頻生成領(lǐng)域卷出了新高度。

上周,發(fā)布Vidu Q2圖生視頻不到2周,Vidu10月21日再次更新:參考生、時長最多可延長至五分鐘、APP從AI創(chuàng)作平臺轉(zhuǎn)變?yōu)橐徽臼紸I內(nèi)容社交平臺。

生數(shù)科技的緊迫感并非孤例。上上周,10月15日,百度視頻生成模型蒸汽機(jī)再次升級——這已經(jīng)是其7月 2日上線以來的第三次重大升級。

這兩場密集發(fā)布背后,是10月1日OpenAI扔下的那顆“炸彈”。當(dāng)天,Sora 2及其社交應(yīng)用上線,憑借生成技術(shù)的突破和社交化的創(chuàng)新玩法,首周下載量超ChatGPT同期,OpenAI CEO山姆·奧特曼“偷GPU被抓”“與李小龍對打”等內(nèi)容席卷全網(wǎng)。

全球巨頭的“應(yīng)激反應(yīng)”迅速展開。10月8日,埃隆·馬斯克xAI推出Imagine v0.9,以20秒快速生成、全用戶免費(fèi)發(fā)起“反擊”;10月16日,谷歌發(fā)布Veo 3.1,強(qiáng)調(diào)物理引擎精準(zhǔn)度,其Fast版本生成速度提升3倍。國內(nèi)戰(zhàn)場更顯激烈:從百度蒸汽機(jī)到快手可靈,再到生數(shù)科技和好耶科技(FilmAction),都是“國慶中秋8天無休”的狀態(tài),快手研究院農(nóng)雅晴直言:“這個行業(yè)本來就很卷,節(jié)假日加班并不意外”。

這場席卷全球的AI視頻生成“軍備競賽”,早已超越單純的技術(shù)比拼。從硅谷創(chuàng)業(yè)公司到中國互聯(lián)網(wǎng)大廠,從OpenAI到谷歌,從百度、可靈到好耶、生數(shù),近百億美元資本與數(shù)千名工程師的投入,折射出科技產(chǎn)業(yè)對下一代內(nèi)容交互革命的集體押注。喧囂背后,技術(shù)突破與商業(yè)泡沫、創(chuàng)作平權(quán)與職業(yè)替代、創(chuàng)新紅利與倫理風(fēng)險(xiǎn)的博弈,正將這個賽道推向更復(fù)雜的十字路口。

現(xiàn)象級爆發(fā):Sora2點(diǎn)燃了“火藥桶”

在Sora2最初放出的視頻中,籃球投偏后反彈落地、花滑選手頭頂一只貓完成三周半跳、雨滴落地后濺起,甚至多物體復(fù)雜場景的運(yùn)動,都能精準(zhǔn)模擬物理世界的運(yùn)行規(guī)律。此外,Sora 2實(shí)現(xiàn)了原生音畫同步,支持多語言對白與環(huán)境音效對齊,角色也能在多鏡頭中保持一致。這種接近影視級的生成效果,再次拉高了行業(yè)參照系。

Sora2生成視頻-2-偷GPU.gif

丨Sora2生成的山姆·奧特曼偷GPU

更具突破性的是其社交玩法:用戶上傳一張自拍照,輸入“在月球上跳舞”,Sora 2就能生成10秒高復(fù)刻度的用戶在月球跳舞的視頻,還能通過Remix功能讓好友“加入”共舞。山姆·奧特曼的個人肖像權(quán)開放,網(wǎng)友腦洞大開的玩梗創(chuàng)作進(jìn)一步放大了出圈效應(yīng)。這種“即時創(chuàng)作+社交裂變”的模式,使Sora 2在邀請制下仍5天內(nèi)登頂美國App Store免費(fèi)榜,下載量突破1000萬次,遠(yuǎn)超ChatGPT初期增速。

這場爆發(fā)并非偶然。

技術(shù)層面,無論是對物理世界的模擬精度還是音畫同步、敘事和運(yùn)鏡能力,Sora 2顯然都有了明顯的提升。而它從視頻生成工具升級為基于視頻生成的社交化產(chǎn)品,更是為其出圈加了一把烈火。

對此,好耶科技創(chuàng)始人吳杰茜認(rèn)為,當(dāng)AI視頻生成的技術(shù)提高、門檻降低之后,大眾的視頻化社交需求一定會被進(jìn)一步激發(fā),Sora 2的出圈顯然說明,這是一個經(jīng)過驗(yàn)證的產(chǎn)品方向。更重要的是,“這極大提高了AI視頻生成的大眾關(guān)注度和認(rèn)知度,給相關(guān)企業(yè)帶來更多的市場機(jī)會。”

當(dāng)前,AI視頻生成已經(jīng)在電商、廣告、短視頻等多個領(lǐng)域開始落地,甚至參與影視制作:Netflix在2023年就發(fā)布了首部AIGC動畫短片《犬與少年》;2024年,快手聯(lián)合李少紅、賈樟柯等九位知名導(dǎo)演開啟了“可靈AI導(dǎo)演共創(chuàng)計(jì)劃”,推出了9部AIGC電影短片;今年4月,新加坡上映了全球首部院線公映的AI電影《海上女王鄭一嫂》,長達(dá)70分鐘,成本尚不及傳統(tǒng)方式的1/10。當(dāng)制作商業(yè)視頻的成本指數(shù)級下降,需求的爆發(fā)就順理成章。

據(jù)Fortune Business  Insights數(shù)據(jù),2024年全球AI視頻生成市場規(guī)模已達(dá)6.15億美元,2025年將達(dá)到7.17億美元,預(yù)計(jì)2032年將增至25.63億美元,年復(fù)合增長率達(dá)20%。中金更為樂觀,認(rèn)為僅中期來看,創(chuàng)作者和B端生產(chǎn)力工具市場規(guī)模就有望突破100億美元。

全球競速:科技巨頭的“生存焦慮”與創(chuàng)業(yè)公司的“生死時速”

Sora2的發(fā)布和出圈,瞬間激活了全球科技公司的神經(jīng)。馬斯克推出Imagine v0.9,主打“電影級運(yùn)鏡”,支持“一鏡到底”生成;谷歌發(fā)布Veo 3.1和Veo3.1Fast,前者強(qiáng)調(diào)“物理引擎精準(zhǔn)度”,后者則將生成速度提升3倍。

在國內(nèi),無論是科技大廠還是初創(chuàng)公司,這種競速也在上演。與谷歌同日,百度10月15日發(fā)布蒸汽機(jī)升級版,支持無限時長生成和實(shí)時交互;生數(shù)科技10月21日推出Vidu Q2,首次上線“視頻延長”功能,最長擴(kuò)展至5分鐘,其“生成演技”技術(shù)能精準(zhǔn)控制人物微表情,確保同一角色在不同場景中的一致性。

百度蒸汽機(jī)-2.jpg丨百度蒸汽機(jī)在行業(yè)內(nèi)首次實(shí)現(xiàn)AI長視頻實(shí)時交互生成

值得一提的是,百度蒸汽機(jī)團(tuán)隊(duì)采用自回歸擴(kuò)散模型,并結(jié)合流式滑窗架構(gòu),在行業(yè)內(nèi)首次實(shí)現(xiàn)了AI長視頻實(shí)時交互生成:在生成過程中,用戶可實(shí)時交互,隨時改寫內(nèi)容或擴(kuò)寫續(xù)集,這意味著 AI 視頻生成從 “開盲盒”“一次性輸出” 進(jìn)入 “動態(tài)創(chuàng)作流” 階段。

Vidu Q2.jpg丨Vidu Q2首頁,玩法對標(biāo)Sora2

Vidu 更是在社交玩法上直接對標(biāo)Sora2。在Vidu AI APP,點(diǎn)擊“二次創(chuàng)作”,@一下主體就可以生成一段合拍視頻,可以與自己喜歡的角色合拍,也可以基于他人創(chuàng)作的視頻進(jìn)行二創(chuàng)。APP里還內(nèi)置了海量主體庫,以及包括人物、動物、特效等的豐富素材,用戶可以直接選用喜歡的主體,隨時隨地隨手生成你想要的視頻。不生成也沒關(guān)系,你大可以像刷視頻號或抖音一樣刷各類AI視頻內(nèi)容。Vidu AI APP也已經(jīng)成了集內(nèi)容創(chuàng)作、互動和分發(fā)于一體的平臺。

與吳杰茜的對話是在周日(10月26日)下午,她直言“沒有周末,每天都排滿了”。她創(chuàng)立的好耶科技(FilmAction)專注于完整劇集的制作,Sora2發(fā)布之后,其團(tuán)隊(duì)更是一直處于連軸轉(zhuǎn)的狀態(tài)。

時不我待的緊迫感背后是創(chuàng)業(yè)公司的生存焦慮。2023年以來,國內(nèi)AI視頻初創(chuàng)企業(yè)超過15家,但隨著技術(shù)進(jìn)一步成熟,行業(yè)已從技術(shù)競賽轉(zhuǎn)向商業(yè)化驗(yàn)證階段,正在經(jīng)歷快速洗牌,頭部效應(yīng)顯著。有不愿具名的業(yè)內(nèi)人士預(yù)測,今年會成為存亡分水嶺,活下來的不會超過3家。

filmaction.png丨FilmAction支持一鍵生成完整敘事級短片

不過,對于Sora2帶來的這種競速加劇,吳杰茜認(rèn)為是行業(yè)利好:“能給同行帶來更多機(jī)會,市場足夠大,各家企業(yè)都能分到蛋糕,關(guān)鍵在于產(chǎn)品力和落地能力”。她介紹,F(xiàn)ilmAction支持一鍵生成完整敘事級短片,非專業(yè)用戶也可以直接產(chǎn)出1分鐘含分鏡、配音等全流程的高質(zhì)量視頻,已經(jīng)承接了大量的短劇業(yè)務(wù)。

行業(yè)競速背后,對超級應(yīng)用的追逐,不僅是全球科技企業(yè)的核心關(guān)切之一,也是資本尋找和下注的目標(biāo)。農(nóng)雅晴和吳杰茜都認(rèn)為,AI視頻生成領(lǐng)域一定會誕生一個超級應(yīng)用。吳杰茜還表示,資本近期正在進(jìn)一步押注國內(nèi)潛力項(xiàng)目,但并未透露具體名稱。

三重隱憂:熱賽道的冷思考

當(dāng)行業(yè)沉浸在“AI視頻的iPhone時刻”的狂熱中,一些深層問題已悄然浮現(xiàn)。這場技術(shù)革命的影響,遠(yuǎn)比想象中復(fù)雜。

首先是技術(shù)狂歡下的需求泡沫和技術(shù)瓶頸。表面繁榮的數(shù)據(jù)背后,可能隱藏著“偽需求”陷阱。某MCN機(jī)構(gòu)負(fù)責(zé)人透露,用AI生成的帶貨視頻轉(zhuǎn)化率比真人拍攝低30%左右,用戶認(rèn)為“畫面很炫,但沒有真人推薦的可信”。這也暴露了當(dāng)前AI視頻在電商場景下的核心矛盾:技術(shù)能解決“有沒有”,卻難以解決情感連接和信任建立。

可靈AI導(dǎo)演共創(chuàng)計(jì)劃 .png丨2024年,快手聯(lián)合賈樟柯等九位導(dǎo)演發(fā)起“可靈AI導(dǎo)演共創(chuàng)計(jì)劃”,已推出9部電影短片

而AI生成視頻的影視級應(yīng)用,目前依然處于前期的探索階段,所謂“影視圈抖三抖”不過是一種修辭。FilmAction雖然支持一鍵生成完整敘事級短片,但吳杰茜依然明確表示,AI無法達(dá)到完全專業(yè)和商業(yè)化的水平,只能輔助創(chuàng)作者從0-5的基礎(chǔ)部分。同樣,盡管快手也已經(jīng)較早開始了AI影視化嘗試,但農(nóng)雅晴依然謹(jǐn)慎表示:“在影視化的規(guī)模化落地應(yīng)用尚不確定。”

其次是創(chuàng)意平權(quán)與職業(yè)替代的陣痛,AI視頻生成能力的提升正在消解專業(yè)壁壘。過去一條廣告需要腳本、分鏡、拍攝、剪輯等多工種協(xié)作,現(xiàn)在一個人用AI就能完成。這自然使中小創(chuàng)作者獲得了前所未有的機(jī)會,但也讓傳統(tǒng)影視從業(yè)者面臨失業(yè)沖擊。更令人唏噓的是,AI催生的新職業(yè)可能最先被顛覆。一年前,AI分鏡師還被視為AIGC時代“饋贈”的一個香餑餑,但如今,根據(jù)劇本生成分鏡幾乎已經(jīng)成為AI視頻生成工具的標(biāo)配。

擬態(tài)環(huán)境的混亂和認(rèn)知危機(jī)則是AI視頻對我們現(xiàn)實(shí)信息環(huán)境層面的影響。柏拉圖的“洞穴寓言”中,囚徒通過墻上的影子認(rèn)識世界;如今,AI生成的視頻讓影子更逼真,卻可能更扭曲。當(dāng)“奧特曼偷GPU”的視頻被大量轉(zhuǎn)發(fā),當(dāng)AI生成的明星出軌片段在社交媒體瘋傳,公眾的信息甄別能力正面臨嚴(yán)峻考驗(yàn)。技術(shù)狂奔時,我們是不是也需要問一問:用戶真的需要無限逼真的視頻嗎?可靠、值得信任的信息是不是更難獲得?

結(jié)語:視頻生成的“iPhone時刻”之后

2022年11月30日,ChatGPT的發(fā)布標(biāo)志著AI從實(shí)驗(yàn)室真正走向大眾;2025年10月,Sora2的爆發(fā)正將視頻生成推向類似拐點(diǎn)。但歷史告訴我們,技術(shù)革命的影響往往需要更長時間顯現(xiàn),就像互聯(lián)網(wǎng)誕生30年后,我們才真正理解其對社會的全方位重塑。

AI視頻生成賽道的火熱,本質(zhì)是科技企業(yè)對下一代內(nèi)容交互范式的爭奪。與其說AI視頻生成是在制造工具,不如說它是在塑造未來的表達(dá)方式。在這場競賽中,既有技術(shù)突破的興奮,也有泡沫風(fēng)險(xiǎn)的隱憂;既有創(chuàng)作平權(quán)的曙光,也有職業(yè)替代的陣痛。最終能存活下來的玩家,不僅需要技術(shù)實(shí)力,更需要對人性的洞察和對責(zé)任的敬畏。當(dāng)AI視頻生成真正成為全民表達(dá)的工具,其價值將超越商業(yè)本身,成為人類創(chuàng)意的放大器。而這一天的到來,需要技術(shù)的持續(xù)突破,更需要整個社會做好準(zhǔn)備:準(zhǔn)備好迎接更豐富的創(chuàng)意,也準(zhǔn)備好應(yīng)對更復(fù)雜的挑戰(zhàn)。

每一次技術(shù)狂奔,都是舊世界裂縫里透出的光。AI視頻生成把“制片廠”塞進(jìn)顯卡,讓創(chuàng)意平權(quán),也留給我們多重思考。這個賽道會不會真的誕生AI時代的第一個超級應(yīng)用不重要,重要的是,這是新世界被撕下的第一張?zhí)羌,裹著AI時代真正的命題:當(dāng)算法可以模擬一切感官,人類還愿意為什么樣的故事買單?當(dāng)算力成為基礎(chǔ)設(shè)施,創(chuàng)意、情感與信任才是最后的稀缺。

火焰還在升騰,有人看見灰燼,有人看見晨星。

END

       原文標(biāo)題 : 從Sora2到蒸汽機(jī)2:被引爆的AI視頻全球競速

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號