Stable Video Diffusion 发布,视频生成真正开始“平民化”了

AI PM 编辑部 · 2023年11月23日 · 5 阅读 · AI/人工智能

正在加载视频...

视频章节

当所有人还在被 OpenAI 的新闻刷屏时,Stability AI 突然扔出了一颗“技术炸弹”:Stable Video Diffusion。它不是炫技 Demo,而是一个明确指向未来的视频生成基础模型,正在悄悄降低视频创作的门槛。

Stable Video Diffusion 发布,视频生成真正开始“平民化”了

当所有人还在被 OpenAI 的新闻刷屏时,Stability AI 突然扔出了一颗“技术炸弹”:Stable Video Diffusion。它不是炫技 Demo,而是一个明确指向未来的视频生成基础模型,正在悄悄降低视频创作的门槛。

视频生成的关键拐点,终于不是“少数人的玩具”了

如果你觉得生成式视频还停留在“炫但没用”,那可能是因为你错过了这次更新。Stable Video Diffusion 是 Stability AI 发布的首个视频生成基础模型,直接建立在 Stable Diffusion 图像模型之上。这一点很关键——它意味着视频不再是孤立的黑盒,而是可以像图像生态一样,被不断微调、扩展、二次开发。

视频生成一直落后于文生图,一个核心原因是门槛太高:算力、数据、工程复杂度都不友好。但 Stability 这次明确释放了一个信号:他们要复制 Stable Diffusion 在图像领域“全民化”的路线。模型一发布,就同步开源代码到 GitHub、权重放在 Hugging Face,这在视频生成领域依然是极少见的操作。

更重要的是趋势判断。视频的价值不只是“更酷”,而是当创作门槛被拉低后,内容形态本身会发生变化。正如主播提到的,早期用户已经在用短视频片段拼接出完整叙事。Stable Video Diffusion 的出现,很可能会加速这种新叙事方式的爆发。

14帧和25帧不重要,重要的是“可复制的生态”

从参数上看,这次发布的只是两个 image-to-video 模型:分别生成 14 帧和 25 帧,帧率可在 3–30 FPS 调整。听起来并不惊艳,甚至不如某些商业产品“丝滑”。但真正值得注意的,是 Stability 在公告中那句被很多人忽略的话:这是“第一步”。

他们明确表示,这个视频模型可以通过微调,适配多视角合成等下游任务,并计划构建一个类似 Stable Diffusion 的完整生态。这意味着什么?意味着未来的视频生成,很可能不再是 Runway、Pika 这种“你用我给你的功能”,而是像 SD 一样,出现大量社区模型、风格模型、垂直场景模型。

Stability 甚至声称,在外部评测中已经超过 Runway 和 Pika Labs。但即便不看性能对比,单是“研究许可证 + 可本地运行”这一点,就足以让大量研究者和创作者提前上车。唯一的限制也很清晰:暂时不能商用。这更像是在为下一阶段的爆发做蓄水。

当视频起飞,行业却被另一件事“拖住了脚”

有意思的是,就在视频生成迈出关键一步的同时,整个 AI 行业仍然被版权和算力问题拉扯着。

一边是 OpenAI 和 Microsoft 被新的作者版权集体诉讼点名,指控其训练中使用了大量非虚构作品;另一边,Sarah Silverman 针对 Meta 的诉讼却遭遇重挫,法官直言“模型本身是侵权衍生物”的说法站不住脚。这释放了一个非常现实的信号:未来的版权之争,可能不再围绕“训练本身”,而是转向“是否生成了可识别的侵权结果”。

与此同时,NVIDIA 继续交出夸张的财报,但市场已经开始担心出口管制对长期增长的影响。反倒是另一条线索值得关注:HP 直接预判,AI 会让 PC 市场增长翻倍,因为模型会越来越多地在本地运行。视频生成模型一旦下沉到边缘设备,创作和算力的关系也会被重新定义。

总结

Stable Video Diffusion 的真正意义,不在于现在能生成多长、多清晰的视频,而在于它把“视频生成”从封闭产品,拉回到了可演化的基础模型轨道上。对从业者来说,这意味着三个行动点:第一,尽早熟悉视频生成的模型结构,而不只是用工具;第二,关注微调和下游任务,那里会诞生新的机会;第三,别忽视版权与本地算力的长期影响。一个很可能发生的未来是:视频生成像文生图一样普及,但真正拉开差距的,是谁最早理解并参与了这套生态。


关键词: Stable Video Diffusion, 生成式视频, Stability AI, 多模态, 视频生成模型

事实核查备注: 需要核查:Stable Video Diffusion 发布时间(2023-11-23);模型帧数(14帧、25帧)与帧率范围(3-30 FPS);Stability AI 关于性能超过 Runway 和 Pika 的声明;研究许可证不可商用的具体条款;OpenAI/Microsoft 版权诉讼是否首次将 Microsoft 列为被告;Sarah Silverman 诉 Meta 案的法官表述原文。