中國電競網(wǎng)

中國電競網(wǎng)

字節(jié)跳動Seedance1.0超越谷歌Veo3:AI視頻生成新標桿 41.4秒極速渲染

劃重點:

?? Seedance1.0的發(fā)布超越了谷歌的 Veo3,成為視頻生成技術的新標桿。  

?? 該模型通過多模態(tài)位置編碼實現(xiàn)了復雜的場景切換和多鏡頭敘事。  

? Seedance1.0在生成速度和視覺一致性上表現(xiàn)優(yōu)異,有望在2025年成為專業(yè)創(chuàng)作的重要工具。

在近期的人工智能視頻生成領域,字節(jié)跳動(TikTok 的母公司)悄然發(fā)布了一款名為 Seedance1.0的新模型,該模型在獨立的評測中已經(jīng)超越了谷歌最新推出的 Veo3。Veo3以其音頻合成和電影級工具而受到廣泛關注,但 Seedance1.0的技術實力卻令人刮目相看,成為視頻生成的領頭羊。

Seedance1.0的研究論文中詳細介紹了該模型的創(chuàng)新之處。字節(jié)跳動的團隊通過對空間和時間層的解耦,結(jié)合了多模態(tài)位置編碼,從而使得該模型能夠同時處理文本到視頻和圖像到視頻的生成任務。這樣的方法支持復雜的場景切換和多鏡頭敘事,保持了一致的主題表現(xiàn)。

字節(jié)跳動Seedance1.0超越谷歌Veo3:AI視頻生成新標桿 41.4秒極速渲染

此外,Seedance1.0的性能離不開字節(jié)跳動強大的數(shù)據(jù)管道。團隊精心構(gòu)建了一個大規(guī)模、多來源的數(shù)據(jù)集,配有詳細的雙語注釋和豐富的動作與靜態(tài)特征標注,確保生成內(nèi)容的準確性。同時,采用了一種新穎的強化學習設置,結(jié)合了三個獎勵模型,重點關注基礎對齊、動作質(zhì)量和美觀度。

字節(jié)跳動Seedance1.0超越谷歌Veo3:AI視頻生成新標桿 41.4秒極速渲染

在評測中,Seedance1.0在多個維度上超過了 Veo3。在與電影導演合作開發(fā)的 SeedVideoBench 基準測試中,該模型在遵循提示和動作真實感方面取得了更高的分數(shù)。在圖像到視頻的任務中,Seedance 保持了輸入幀的視覺一致性,而 Veo3則在某些情況下出現(xiàn)了光照和紋理的變化。

字節(jié)跳動Seedance1.0超越谷歌Veo3:AI視頻生成新標桿 41.4秒極速渲染

在推理性能方面,Seedance1.0也表現(xiàn)出色。該模型能夠在41.4秒內(nèi)生成一段1080p 的五秒視頻,這一速度遠超其他競爭對手,如 Sora、Runway Gen-4和 Veo3。字節(jié)跳動還表示,他們在降低成本和延遲方面取得了重大進展,使得視頻生成向?qū)崟r應用的目標邁進了一步。

Seedance1.0計劃于2025年6月集成到 Doubao 和 Jimeng 等平臺,旨在顯著改善專業(yè)工作流程和常規(guī)創(chuàng)作任務。雖然 Veo3因首次結(jié)合了真實視頻與環(huán)境音效和對話而備受矚目,但 Seedance1.0在視覺保真度、運動穩(wěn)定性和敘事連貫性方面表現(xiàn)更為出色,雖然在音頻能力上有所欠缺。


標簽:Seedance1.0 Veo3 AI視頻生成 字節(jié)跳動 多模態(tài)編碼 抖音 TikTok