訂閱
糾錯(cuò)
加入自媒體

從Sora2到蒸汽機(jī)2:被引爆的AI視頻全球競(jìng)速

翼言商業(yè)觀(guān)察

“AI視頻生成領(lǐng)域,一定會(huì)誕生一個(gè)超級(jí)應(yīng)用。”

10月以來(lái),AI視頻生成領(lǐng)域卷出了新高度。

上周,發(fā)布Vidu Q2圖生視頻不到2周,Vidu10月21日再次更新:參考生、時(shí)長(zhǎng)最多可延長(zhǎng)至五分鐘、APP從AI創(chuàng)作平臺(tái)轉(zhuǎn)變?yōu)橐徽臼紸I內(nèi)容社交平臺(tái)。

生數(shù)科技的緊迫感并非孤例。上上周,10月15日,百度視頻生成模型蒸汽機(jī)再次升級(jí)——這已經(jīng)是其7月 2日上線(xiàn)以來(lái)的第三次重大升級(jí)。

這兩場(chǎng)密集發(fā)布背后,是10月1日OpenAI扔下的那顆“炸彈”。當(dāng)天,Sora 2及其社交應(yīng)用上線(xiàn),憑借生成技術(shù)的突破和社交化的創(chuàng)新玩法,首周下載量超ChatGPT同期,OpenAI CEO山姆·奧特曼“偷GPU被抓”“與李小龍對(duì)打”等內(nèi)容席卷全網(wǎng)。

全球巨頭的“應(yīng)激反應(yīng)”迅速展開(kāi)。10月8日,埃隆·馬斯克xAI推出Imagine v0.9,以20秒快速生成、全用戶(hù)免費(fèi)發(fā)起“反擊”;10月16日,谷歌發(fā)布Veo 3.1,強(qiáng)調(diào)物理引擎精準(zhǔn)度,其Fast版本生成速度提升3倍。國(guó)內(nèi)戰(zhàn)場(chǎng)更顯激烈:從百度蒸汽機(jī)到快手可靈,再到生數(shù)科技和好耶科技(FilmAction),都是“國(guó)慶中秋8天無(wú)休”的狀態(tài),快手研究院農(nóng)雅晴直言:“這個(gè)行業(yè)本來(lái)就很卷,節(jié)假日加班并不意外”。

這場(chǎng)席卷全球的AI視頻生成“軍備競(jìng)賽”,早已超越單純的技術(shù)比拼。從硅谷創(chuàng)業(yè)公司到中國(guó)互聯(lián)網(wǎng)大廠(chǎng),從OpenAI到谷歌,從百度、可靈到好耶、生數(shù),近百億美元資本與數(shù)千名工程師的投入,折射出科技產(chǎn)業(yè)對(duì)下一代內(nèi)容交互革命的集體押注。喧囂背后,技術(shù)突破與商業(yè)泡沫、創(chuàng)作平權(quán)與職業(yè)替代、創(chuàng)新紅利與倫理風(fēng)險(xiǎn)的博弈,正將這個(gè)賽道推向更復(fù)雜的十字路口。

現(xiàn)象級(jí)爆發(fā):Sora2點(diǎn)燃了“火藥桶”

在Sora2最初放出的視頻中,籃球投偏后反彈落地、花滑選手頭頂一只貓完成三周半跳、雨滴落地后濺起,甚至多物體復(fù)雜場(chǎng)景的運(yùn)動(dòng),都能精準(zhǔn)模擬物理世界的運(yùn)行規(guī)律。此外,Sora 2實(shí)現(xiàn)了原生音畫(huà)同步,支持多語(yǔ)言對(duì)白與環(huán)境音效對(duì)齊,角色也能在多鏡頭中保持一致。這種接近影視級(jí)的生成效果,再次拉高了行業(yè)參照系。

Sora2生成視頻-2-偷GPU.gif

丨Sora2生成的山姆·奧特曼偷GPU

更具突破性的是其社交玩法:用戶(hù)上傳一張自拍照,輸入“在月球上跳舞”,Sora 2就能生成10秒高復(fù)刻度的用戶(hù)在月球跳舞的視頻,還能通過(guò)Remix功能讓好友“加入”共舞。山姆·奧特曼的個(gè)人肖像權(quán)開(kāi)放,網(wǎng)友腦洞大開(kāi)的玩梗創(chuàng)作進(jìn)一步放大了出圈效應(yīng)。這種“即時(shí)創(chuàng)作+社交裂變”的模式,使Sora 2在邀請(qǐng)制下仍5天內(nèi)登頂美國(guó)App Store免費(fèi)榜,下載量突破1000萬(wàn)次,遠(yuǎn)超ChatGPT初期增速。

這場(chǎng)爆發(fā)并非偶然。

技術(shù)層面,無(wú)論是對(duì)物理世界的模擬精度還是音畫(huà)同步、敘事和運(yùn)鏡能力,Sora 2顯然都有了明顯的提升。而它從視頻生成工具升級(jí)為基于視頻生成的社交化產(chǎn)品,更是為其出圈加了一把烈火。

對(duì)此,好耶科技創(chuàng)始人吳杰茜認(rèn)為,當(dāng)AI視頻生成的技術(shù)提高、門(mén)檻降低之后,大眾的視頻化社交需求一定會(huì)被進(jìn)一步激發(fā),Sora 2的出圈顯然說(shuō)明,這是一個(gè)經(jīng)過(guò)驗(yàn)證的產(chǎn)品方向。更重要的是,“這極大提高了AI視頻生成的大眾關(guān)注度和認(rèn)知度,給相關(guān)企業(yè)帶來(lái)更多的市場(chǎng)機(jī)會(huì)。”

當(dāng)前,AI視頻生成已經(jīng)在電商、廣告、短視頻等多個(gè)領(lǐng)域開(kāi)始落地,甚至參與影視制作:Netflix在2023年就發(fā)布了首部AIGC動(dòng)畫(huà)短片《犬與少年》;2024年,快手聯(lián)合李少紅、賈樟柯等九位知名導(dǎo)演開(kāi)啟了“可靈AI導(dǎo)演共創(chuàng)計(jì)劃”,推出了9部AIGC電影短片;今年4月,新加坡上映了全球首部院線(xiàn)公映的AI電影《海上女王鄭一嫂》,長(zhǎng)達(dá)70分鐘,成本尚不及傳統(tǒng)方式的1/10。當(dāng)制作商業(yè)視頻的成本指數(shù)級(jí)下降,需求的爆發(fā)就順理成章。

據(jù)Fortune Business  Insights數(shù)據(jù),2024年全球AI視頻生成市場(chǎng)規(guī)模已達(dá)6.15億美元,2025年將達(dá)到7.17億美元,預(yù)計(jì)2032年將增至25.63億美元,年復(fù)合增長(zhǎng)率達(dá)20%。中金更為樂(lè)觀(guān),認(rèn)為僅中期來(lái)看,創(chuàng)作者和B端生產(chǎn)力工具市場(chǎng)規(guī)模就有望突破100億美元。

全球競(jìng)速:科技巨頭的“生存焦慮”與創(chuàng)業(yè)公司的“生死時(shí)速”

Sora2的發(fā)布和出圈,瞬間激活了全球科技公司的神經(jīng)。馬斯克推出Imagine v0.9,主打“電影級(jí)運(yùn)鏡”,支持“一鏡到底”生成;谷歌發(fā)布Veo 3.1和Veo3.1Fast,前者強(qiáng)調(diào)“物理引擎精準(zhǔn)度”,后者則將生成速度提升3倍。

在國(guó)內(nèi),無(wú)論是科技大廠(chǎng)還是初創(chuàng)公司,這種競(jìng)速也在上演。與谷歌同日,百度10月15日發(fā)布蒸汽機(jī)升級(jí)版,支持無(wú)限時(shí)長(zhǎng)生成和實(shí)時(shí)交互;生數(shù)科技10月21日推出Vidu Q2,首次上線(xiàn)“視頻延長(zhǎng)”功能,最長(zhǎng)擴(kuò)展至5分鐘,其“生成演技”技術(shù)能精準(zhǔn)控制人物微表情,確保同一角色在不同場(chǎng)景中的一致性。

百度蒸汽機(jī)-2.jpg丨百度蒸汽機(jī)在行業(yè)內(nèi)首次實(shí)現(xiàn)AI長(zhǎng)視頻實(shí)時(shí)交互生成

值得一提的是,百度蒸汽機(jī)團(tuán)隊(duì)采用自回歸擴(kuò)散模型,并結(jié)合流式滑窗架構(gòu),在行業(yè)內(nèi)首次實(shí)現(xiàn)了AI長(zhǎng)視頻實(shí)時(shí)交互生成:在生成過(guò)程中,用戶(hù)可實(shí)時(shí)交互,隨時(shí)改寫(xiě)內(nèi)容或擴(kuò)寫(xiě)續(xù)集,這意味著 AI 視頻生成從 “開(kāi)盲盒”“一次性輸出” 進(jìn)入 “動(dòng)態(tài)創(chuàng)作流” 階段。

Vidu Q2.jpg丨Vidu Q2首頁(yè),玩法對(duì)標(biāo)Sora2

Vidu 更是在社交玩法上直接對(duì)標(biāo)Sora2。在Vidu AI APP,點(diǎn)擊“二次創(chuàng)作”,@一下主體就可以生成一段合拍視頻,可以與自己喜歡的角色合拍,也可以基于他人創(chuàng)作的視頻進(jìn)行二創(chuàng)。APP里還內(nèi)置了海量主體庫(kù),以及包括人物、動(dòng)物、特效等的豐富素材,用戶(hù)可以直接選用喜歡的主體,隨時(shí)隨地隨手生成你想要的視頻。不生成也沒(méi)關(guān)系,你大可以像刷視頻號(hào)或抖音一樣刷各類(lèi)AI視頻內(nèi)容。Vidu AI APP也已經(jīng)成了集內(nèi)容創(chuàng)作、互動(dòng)和分發(fā)于一體的平臺(tái)。

與吳杰茜的對(duì)話(huà)是在周日(10月26日)下午,她直言“沒(méi)有周末,每天都排滿(mǎn)了”。她創(chuàng)立的好耶科技(FilmAction)專(zhuān)注于完整劇集的制作,Sora2發(fā)布之后,其團(tuán)隊(duì)更是一直處于連軸轉(zhuǎn)的狀態(tài)。

時(shí)不我待的緊迫感背后是創(chuàng)業(yè)公司的生存焦慮。2023年以來(lái),國(guó)內(nèi)AI視頻初創(chuàng)企業(yè)超過(guò)15家,但隨著技術(shù)進(jìn)一步成熟,行業(yè)已從技術(shù)競(jìng)賽轉(zhuǎn)向商業(yè)化驗(yàn)證階段,正在經(jīng)歷快速洗牌,頭部效應(yīng)顯著。有不愿具名的業(yè)內(nèi)人士預(yù)測(cè),今年會(huì)成為存亡分水嶺,活下來(lái)的不會(huì)超過(guò)3家。

filmaction.png丨FilmAction支持一鍵生成完整敘事級(jí)短片

不過(guò),對(duì)于Sora2帶來(lái)的這種競(jìng)速加劇,吳杰茜認(rèn)為是行業(yè)利好:“能給同行帶來(lái)更多機(jī)會(huì),市場(chǎng)足夠大,各家企業(yè)都能分到蛋糕,關(guān)鍵在于產(chǎn)品力和落地能力”。她介紹,F(xiàn)ilmAction支持一鍵生成完整敘事級(jí)短片,非專(zhuān)業(yè)用戶(hù)也可以直接產(chǎn)出1分鐘含分鏡、配音等全流程的高質(zhì)量視頻,已經(jīng)承接了大量的短劇業(yè)務(wù)。

行業(yè)競(jìng)速背后,對(duì)超級(jí)應(yīng)用的追逐,不僅是全球科技企業(yè)的核心關(guān)切之一,也是資本尋找和下注的目標(biāo)。農(nóng)雅晴和吳杰茜都認(rèn)為,AI視頻生成領(lǐng)域一定會(huì)誕生一個(gè)超級(jí)應(yīng)用。吳杰茜還表示,資本近期正在進(jìn)一步押注國(guó)內(nèi)潛力項(xiàng)目,但并未透露具體名稱(chēng)。

三重隱憂(yōu):熱賽道的冷思考

當(dāng)行業(yè)沉浸在“AI視頻的iPhone時(shí)刻”的狂熱中,一些深層問(wèn)題已悄然浮現(xiàn)。這場(chǎng)技術(shù)革命的影響,遠(yuǎn)比想象中復(fù)雜。

首先是技術(shù)狂歡下的需求泡沫和技術(shù)瓶頸。表面繁榮的數(shù)據(jù)背后,可能隱藏著“偽需求”陷阱。某MCN機(jī)構(gòu)負(fù)責(zé)人透露,用AI生成的帶貨視頻轉(zhuǎn)化率比真人拍攝低30%左右,用戶(hù)認(rèn)為“畫(huà)面很炫,但沒(méi)有真人推薦的可信”。這也暴露了當(dāng)前AI視頻在電商場(chǎng)景下的核心矛盾:技術(shù)能解決“有沒(méi)有”,卻難以解決情感連接和信任建立。

可靈AI導(dǎo)演共創(chuàng)計(jì)劃 .png丨2024年,快手聯(lián)合賈樟柯等九位導(dǎo)演發(fā)起“可靈AI導(dǎo)演共創(chuàng)計(jì)劃”,已推出9部電影短片

而AI生成視頻的影視級(jí)應(yīng)用,目前依然處于前期的探索階段,所謂“影視圈抖三抖”不過(guò)是一種修辭。FilmAction雖然支持一鍵生成完整敘事級(jí)短片,但吳杰茜依然明確表示,AI無(wú)法達(dá)到完全專(zhuān)業(yè)和商業(yè)化的水平,只能輔助創(chuàng)作者從0-5的基礎(chǔ)部分。同樣,盡管快手也已經(jīng)較早開(kāi)始了AI影視化嘗試,但農(nóng)雅晴依然謹(jǐn)慎表示:“在影視化的規(guī)模化落地應(yīng)用尚不確定。”

其次是創(chuàng)意平權(quán)與職業(yè)替代的陣痛,AI視頻生成能力的提升正在消解專(zhuān)業(yè)壁壘。過(guò)去一條廣告需要腳本、分鏡、拍攝、剪輯等多工種協(xié)作,現(xiàn)在一個(gè)人用AI就能完成。這自然使中小創(chuàng)作者獲得了前所未有的機(jī)會(huì),但也讓傳統(tǒng)影視從業(yè)者面臨失業(yè)沖擊。更令人唏噓的是,AI催生的新職業(yè)可能最先被顛覆。一年前,AI分鏡師還被視為AIGC時(shí)代“饋贈(zèng)”的一個(gè)香餑餑,但如今,根據(jù)劇本生成分鏡幾乎已經(jīng)成為AI視頻生成工具的標(biāo)配。

擬態(tài)環(huán)境的混亂和認(rèn)知危機(jī)則是AI視頻對(duì)我們現(xiàn)實(shí)信息環(huán)境層面的影響。柏拉圖的“洞穴寓言”中,囚徒通過(guò)墻上的影子認(rèn)識(shí)世界;如今,AI生成的視頻讓影子更逼真,卻可能更扭曲。當(dāng)“奧特曼偷GPU”的視頻被大量轉(zhuǎn)發(fā),當(dāng)AI生成的明星出軌片段在社交媒體瘋傳,公眾的信息甄別能力正面臨嚴(yán)峻考驗(yàn)。技術(shù)狂奔時(shí),我們是不是也需要問(wèn)一問(wèn):用戶(hù)真的需要無(wú)限逼真的視頻嗎?可靠、值得信任的信息是不是更難獲得?

結(jié)語(yǔ):視頻生成的“iPhone時(shí)刻”之后

2022年11月30日,ChatGPT的發(fā)布標(biāo)志著AI從實(shí)驗(yàn)室真正走向大眾;2025年10月,Sora2的爆發(fā)正將視頻生成推向類(lèi)似拐點(diǎn)。但歷史告訴我們,技術(shù)革命的影響往往需要更長(zhǎng)時(shí)間顯現(xiàn),就像互聯(lián)網(wǎng)誕生30年后,我們才真正理解其對(duì)社會(huì)的全方位重塑。

AI視頻生成賽道的火熱,本質(zhì)是科技企業(yè)對(duì)下一代內(nèi)容交互范式的爭(zhēng)奪。與其說(shuō)AI視頻生成是在制造工具,不如說(shuō)它是在塑造未來(lái)的表達(dá)方式。在這場(chǎng)競(jìng)賽中,既有技術(shù)突破的興奮,也有泡沫風(fēng)險(xiǎn)的隱憂(yōu);既有創(chuàng)作平權(quán)的曙光,也有職業(yè)替代的陣痛。最終能存活下來(lái)的玩家,不僅需要技術(shù)實(shí)力,更需要對(duì)人性的洞察和對(duì)責(zé)任的敬畏。當(dāng)AI視頻生成真正成為全民表達(dá)的工具,其價(jià)值將超越商業(yè)本身,成為人類(lèi)創(chuàng)意的放大器。而這一天的到來(lái),需要技術(shù)的持續(xù)突破,更需要整個(gè)社會(huì)做好準(zhǔn)備:準(zhǔn)備好迎接更豐富的創(chuàng)意,也準(zhǔn)備好應(yīng)對(duì)更復(fù)雜的挑戰(zhàn)。

每一次技術(shù)狂奔,都是舊世界裂縫里透出的光。AI視頻生成把“制片廠(chǎng)”塞進(jìn)顯卡,讓創(chuàng)意平權(quán),也留給我們多重思考。這個(gè)賽道會(huì)不會(huì)真的誕生AI時(shí)代的第一個(gè)超級(jí)應(yīng)用不重要,重要的是,這是新世界被撕下的第一張?zhí)羌,裹著AI時(shí)代真正的命題:當(dāng)算法可以模擬一切感官,人類(lèi)還愿意為什么樣的故事買(mǎi)單?當(dāng)算力成為基礎(chǔ)設(shè)施,創(chuàng)意、情感與信任才是最后的稀缺。

火焰還在升騰,有人看見(jiàn)灰燼,有人看見(jiàn)晨星。

END

       原文標(biāo)題 : 從Sora2到蒸汽機(jī)2:被引爆的AI視頻全球競(jìng)速

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀(guān)點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)