据《界面新闻》报导,字节跳动影片创作模型Seedance 2.0 周四(12 日)正式上线,旗下AI 产品豆包和即梦宣布接入。该模型内测期间即获得巨量关注,在海内外积攒了大批潜在用户。
Seedance 2.0 支持图像、影片、音频、文本四种模态输入,用户可以用图片来说明想要的画面风格,用影片指定角色的动作和镜头的变化,用一段音频表达预期的节奏和氛围。
字节官方表示,Seedance 2.0 采用稀疏架构来提升训练和推理效率,基于统一的多模态影片生成架构,模型涌现出了更强大的泛化能力,由此实现了较高品质音频的音画同步生成,还可支援组合的多模态参考、影片编辑、影片延长等功能。
由于存在一定个资安全等AI 治理层面争议,字节此前暂时性闭了Seedance 2.0 的真人人脸参考功能,不过在正式上线时保留了用户个人的录音录影真人校验,并生成用户本人形象的数位人分身功能。用户可用该分身生成AI 影片。
一名海外创作者(或原PO)发布了Seedance 2.0 与1.5 的效果对比影片,全球首富马斯克在周四转发了这个帖子,并称「这发生得也太快了(It"s happening fast)」。
游戏科学创始人冯骥在内测期间便给出「杀死比赛」(Kill the game)的评价,并称这很客观。在对模型的性能、多模态、效率、低门槛等特性发表看法的同时,冯骥还提出了「影片全民化」和「假影片泛滥与信任危机」两大趋势。
从效果来看,这两个趋势的确在向现实演变。一名摄影创作者(或原PO)用Seedance 2.0 生成了一段富有Nike 特色的运动品牌广告,包含平衡木体操、拳击、游泳、跑步四个运动场景,有快慢镜头、近远景特写镜头切换,整体画面气质颇接近真实广告。
大批用户在评论区表示,除了游泳场景选手腿部动作还不太真实外,其他画面已经很难分辨是否由AI 生成。













