AI视频不再一段一段拼:LTX用“分层创作”重写视频生成逻辑

AI PM 编辑部 · 2024年05月30日 · 2 阅读 · AI/人工智能

正在加载视频...

视频章节

大多数AI视频工具,还停留在“生成3秒、再补3秒”的原始阶段,而LTX Studio直接掀桌子:它从一开始就生成完整故事板。Riley Brown认为,这种“分层式AI视频创作”不是小改进,而是一次范式切换,可能定义下一代AI视频的工作方式。

AI视频不再一段一段拼:LTX用“分层创作”重写视频生成逻辑

大多数AI视频工具,还停留在“生成3秒、再补3秒”的原始阶段,而LTX Studio直接掀桌子:它从一开始就生成完整故事板。Riley Brown认为,这种“分层式AI视频创作”不是小改进,而是一次范式切换,可能定义下一代AI视频的工作方式。

最反直觉的一点:LTX根本不想先生成画面

过去一年,AI视频平台的主流路径几乎一致:先生成几秒炫酷画面,再靠人工剪辑把它们“拼成一个故事”。结果是——画面惊艳,但叙事破碎。Riley Brown在视频一开头就点破这一点:问题不在模型,而在创作顺序。

LTX Studio选择了一条完全相反的路:先做完整故事板,再生成视频。在它看来,AI视频不该从“镜头”开始,而应该从“故事”开始。这也是Riley称之为“Level-Based AI Video Creation”的核心——把视频拆成三个层级:视频层、场景层、镜头层,像搭积木一样逐层收敛。

这听起来像是传统影视流程,但关键差异在于:每一层都由AI实时联动更新。你不是在剪视频,而是在“指挥一个会自动改稿的导演团队”。

第一层:视频层,AI第一次真正“理解剧情”

在视频层,创作者只需要用自然语言描述一个完整故事。比如Riley在演示中随手写下:暴风中的街道、被疏散的人群、一个男人和一只熊相遇并成为朋友。

接下来发生的事很关键——LTX会自动:
- 拆解角色(人、熊)
- 生成完整时间线
- 构建横跨始终的故事板

你可以一眼看到从开头到结尾的所有事件,而不是零散片段。更重要的是,这个故事板是“活的”:切换为竖屏、更换美术风格(比如黏土风),整个结构会同步调整。

这一步解决了一个长期被忽视的问题:AI视频第一次在“生成前”就保证了整体一致性

第二层:场景层,叙事和情绪终于可控了

进入场景层后,LTX开始显露出它真正面向“创作者”的野心。

每个场景由多个镜头组成,但你不需要逐条重写prompt。只要改一个参数,比如:
- 场景地点:纽约的废弃街道
- 氛围:黑暗光线 + 风暴天气

系统会自动更新该场景下的所有镜头。

更妙的是,LTX会直接提示你叙事冲突。当Riley给场景加了一段旁白后,系统提醒:场景时长不足,语音会被截断——这迫使创作者补充镜头,而不是事后才发现问题。

这本质上是AI在帮你做“导演级检查”:节奏、情绪、声音是否匹配画面。

第三层:镜头层,才轮到你“微操AI”

直到镜头层,LTX才允许你进入传统AI视频工具最熟悉的领域:调prompt、改景别、控运动。

你可以调整:
- 镜头类型(特写、极近景)
- 动作幅度
- 单个镜头的音效

Riley特别指出一个细节:角色的一致性已经“相对稳定”,比如衣服颜色能在多个镜头中保持一致,虽然仍有改进空间。这说明LTX的重心并不在“炫技”,而在“可用性”。

在这里,AI不再是灵感生成器,而是一个听指挥的执行系统。

总结

LTX Studio最重要的启示,并不是它现在生成的视频有多惊艳,而是它重新定义了AI视频的“工作流”。从先生成画面,到先构建叙事,这是一次方向性的转弯。

对AI从业者来说,这意味着两件事:第一,未来的竞争不只在模型质量,而在创作流程设计;第二,会写prompt不再是核心能力,会拆故事、控结构、定节奏才是

LTX目前仍在beta阶段,Riley也明确呼吁用户参与反馈。但可以大胆预判:如果这种分层式创作跑通,它很可能成为AI视频的默认范式。问题只剩一个——你,准备好用“导演思维”来用AI了吗?


关键词: LTX Studio, AI视频生成, 分层式创作, 生成式AI, 多模态

事实核查备注: 需要核查:1)视频发布时间为2024-05-30;2)作者/频道为Riley Brown;3)LTX Studio目前处于beta阶段;4)Riley Brown自述其在AI创作领域的从业与影响力背景;5)视频中对“三个层级”(视频层、场景层、镜头层)的定义与描述是否准确无误。