字節(jié)跳動(dòng)Seedance1.0超越谷歌Veo3：AI視頻生成新標(biāo)桿 41.4秒極速渲染

2025-06-18 倔強(qiáng)青銅 946 網(wǎng)絡(luò)采編

劃重點(diǎn):

?? Seedance1.0的發(fā)布超越了谷歌的 Veo3，成為視頻生成技術(shù)的新標(biāo)桿。

?? 該模型通過多模態(tài)位置編碼實(shí)現(xiàn)了復(fù)雜的場景切換和多鏡頭敘事。

? Seedance1.0在生成速度和視覺一致性上表現(xiàn)優(yōu)異，有望在2025年成為專業(yè)創(chuàng)作的重要工具。

在近期的人工智能視頻生成領(lǐng)域，字節(jié)跳動(dòng)（TikTok 的母公司）悄然發(fā)布了一款名為 Seedance1.0的新模型，該模型在獨(dú)立的評(píng)測(cè)中已經(jīng)超越了谷歌最新推出的 Veo3。Veo3以其音頻合成和電影級(jí)工具而受到廣泛關(guān)注，但 Seedance1.0的技術(shù)實(shí)力卻令人刮目相看，成為視頻生成的領(lǐng)頭羊。

Seedance1.0的研究論文中詳細(xì)介紹了該模型的創(chuàng)新之處。字節(jié)跳動(dòng)的團(tuán)隊(duì)通過對(duì)空間和時(shí)間層的解耦，結(jié)合了多模態(tài)位置編碼，從而使得該模型能夠同時(shí)處理文本到視頻和圖像到視頻的生成任務(wù)。這樣的方法支持復(fù)雜的場景切換和多鏡頭敘事，保持了一致的主題表現(xiàn)。

此外，Seedance1.0的性能離不開字節(jié)跳動(dòng)強(qiáng)大的數(shù)據(jù)管道。團(tuán)隊(duì)精心構(gòu)建了一個(gè)大規(guī)模、多來源的數(shù)據(jù)集，配有詳細(xì)的雙語注釋和豐富的動(dòng)作與靜態(tài)特征標(biāo)注，確保生成內(nèi)容的準(zhǔn)確性。同時(shí)，采用了一種新穎的強(qiáng)化學(xué)習(xí)設(shè)置，結(jié)合了三個(gè)獎(jiǎng)勵(lì)模型，重點(diǎn)關(guān)注基礎(chǔ)對(duì)齊、動(dòng)作質(zhì)量和美觀度。

字節(jié)跳動(dòng)Seedance1.0超越谷歌Veo3：AI視頻生成新標(biāo)桿 41.4秒極速渲染

在評(píng)測(cè)中，Seedance1.0在多個(gè)維度上超過了 Veo3。在與電影導(dǎo)演合作開發(fā)的 SeedVideoBench 基準(zhǔn)測(cè)試中，該模型在遵循提示和動(dòng)作真實(shí)感方面取得了更高的分?jǐn)?shù)。在圖像到視頻的任務(wù)中，Seedance 保持了輸入幀的視覺一致性，而 Veo3則在某些情況下出現(xiàn)了光照和紋理的變化。

字節(jié)跳動(dòng)Seedance1.0超越谷歌Veo3：AI視頻生成新標(biāo)桿 41.4秒極速渲染

在推理性能方面，Seedance1.0也表現(xiàn)出色。該模型能夠在41.4秒內(nèi)生成一段1080p 的五秒視頻，這一速度遠(yuǎn)超其他競爭對(duì)手，如 Sora、Runway Gen-4和 Veo3。字節(jié)跳動(dòng)還表示，他們?cè)诮档统杀竞脱舆t方面取得了重大進(jìn)展，使得視頻生成向?qū)崟r(shí)應(yīng)用的目標(biāo)邁進(jìn)了一步。

Seedance1.0計(jì)劃于2025年6月集成到 Doubao 和 Jimeng 等平臺(tái)，旨在顯著改善專業(yè)工作流程和常規(guī)創(chuàng)作任務(wù)。雖然 Veo3因首次結(jié)合了真實(shí)視頻與環(huán)境音效和對(duì)話而備受矚目，但 Seedance1.0在視覺保真度、運(yùn)動(dòng)穩(wěn)定性和敘事連貫性方面表現(xiàn)更為出色，雖然在音頻能力上有所欠缺。

標(biāo)簽：Seedance1.0 Veo3 AI視頻生成字節(jié)跳動(dòng) 多模態(tài)編碼抖音 TikTok

本文地址： http://sdoldhj.cn/ai/20250618/2096.html

版權(quán)聲明：本站除去原創(chuàng)作品，部分文章為網(wǎng)絡(luò)采編整理或客戶投稿，如有侵權(quán)請(qǐng)聯(lián)系編輯刪除，轉(zhuǎn)載請(qǐng)注明出處！