劃重點:
?? Seedance1.0的發(fā)布超越了谷歌的 Veo3,成為視頻生成技術(shù)的新標(biāo)桿。
?? 該模型通過多模態(tài)位置編碼實現(xiàn)了復(fù)雜的場景切換和多鏡頭敘事。
? Seedance1.0在生成速度和視覺一致性上表現(xiàn)優(yōu)異,有望在2025年成為專業(yè)創(chuàng)作的重要工具。
在近期的人工智能視頻生成領(lǐng)域,字節(jié)跳動(TikTok 的母公司)悄然發(fā)布了一款名為 Seedance1.0的新模型,該模型在獨立的評測中已經(jīng)超越了谷歌最新推出的 Veo3。Veo3以其音頻合成和電影級工具而受到廣泛關(guān)注,但 Seedance1.0的技術(shù)實力卻令人刮目相看,成為視頻生成的領(lǐng)頭羊。
Seedance1.0的研究論文中詳細(xì)介紹了該模型的創(chuàng)新之處。字節(jié)跳動的團(tuán)隊通過對空間和時間層的解耦,結(jié)合了多模態(tài)位置編碼,從而使得該模型能夠同時處理文本到視頻和圖像到視頻的生成任務(wù)。這樣的方法支持復(fù)雜的場景切換和多鏡頭敘事,保持了一致的主題表現(xiàn)。
此外,Seedance1.0的性能離不開字節(jié)跳動強大的數(shù)據(jù)管道。團(tuán)隊精心構(gòu)建了一個大規(guī)模、多來源的數(shù)據(jù)集,配有詳細(xì)的雙語注釋和豐富的動作與靜態(tài)特征標(biāo)注,確保生成內(nèi)容的準(zhǔn)確性。同時,采用了一種新穎的強化學(xué)習(xí)設(shè)置,結(jié)合了三個獎勵模型,重點關(guān)注基礎(chǔ)對齊、動作質(zhì)量和美觀度。
在評測中,Seedance1.0在多個維度上超過了 Veo3。在與電影導(dǎo)演合作開發(fā)的 SeedVideoBench 基準(zhǔn)測試中,該模型在遵循提示和動作真實感方面取得了更高的分?jǐn)?shù)。在圖像到視頻的任務(wù)中,Seedance 保持了輸入幀的視覺一致性,而 Veo3則在某些情況下出現(xiàn)了光照和紋理的變化。
在推理性能方面,Seedance1.0也表現(xiàn)出色。該模型能夠在41.4秒內(nèi)生成一段1080p 的五秒視頻,這一速度遠(yuǎn)超其他競爭對手,如 Sora、Runway Gen-4和 Veo3。字節(jié)跳動還表示,他們在降低成本和延遲方面取得了重大進(jìn)展,使得視頻生成向?qū)崟r應(yīng)用的目標(biāo)邁進(jìn)了一步。
Seedance1.0計劃于2025年6月集成到 Doubao 和 Jimeng 等平臺,旨在顯著改善專業(yè)工作流程和常規(guī)創(chuàng)作任務(wù)。雖然 Veo3因首次結(jié)合了真實視頻與環(huán)境音效和對話而備受矚目,但 Seedance1.0在視覺保真度、運動穩(wěn)定性和敘事連貫性方面表現(xiàn)更為出色,雖然在音頻能力上有所欠缺。
標(biāo)簽:Seedance1.0 Veo3 AI視頻生成 字節(jié)跳動 多模態(tài)編碼 抖音 TikTok