Veo 3.1登场：当AI视频从“震撼演示”走向“可用产品”

AI PM 编辑部 · 2025年10月17日 · 11 阅读 · AI/人工智能

机器学习多模态代码生成生成式AI AI应用 AI Agent AI搜索 Runway Claude 3.5 Sonnet Claude 3 Haiku

正在加载视频...

视频章节

Google发布Veo 3.1，却未能复制V3时期的惊艳时刻。视频模型的竞争焦点，正在从“谁更逼真”转向“谁更好用”。本文通过Veo 3.1、Sora 2、Claude Haiku 4.5与苹果AI动荡等故事，梳理AI产业进入产品化阶段的真实信号。

Veo 3.1登场：当AI视频从“震撼演示”走向“可用产品”

Google发布Veo 3.1，却未能复制V3时期的惊艳时刻。视频模型的竞争焦点，正在从“谁更逼真”转向“谁更好用”。本文通过Veo 3.1、Sora 2、Claude Haiku 4.5与苹果AI动荡等故事，梳理AI产业进入产品化阶段的真实信号。

Veo 3.1：不是更强的魔法，而是更完整的工具箱

为什么Veo 3.1重要？因为它标志着AI视频竞争逻辑的变化。Google在发布中强调，Veo 3.1提升了输出真实感、提示词遵循度和音频质量，但真正的重头戏并不在画质，而在“编辑能力”。

这次更新中，用户可以引入参考图片来固定角色或物体，也可以直接要求模型从已有视频中“移除某个对象”。更进一步，创作者可以提供视频的第一帧和最后一帧，让模型自动补全中间内容；或者基于最后几帧延展视频，从而把多个短片无缝拼接成接近一分钟的短视频。这些功能看似不炫技，却直指真实创作流程中的痛点。

回顾背景更能理解这种转向。Veo V3在2025年5月发布时，被称为“AI视频的分水岭”，首次实现了音画同步，并在真实感上达到当时的顶尖水准。但5个月过去，行业环境已经完全不同。Sora 2、Runway等产品快速跟进，单纯提升模型能力已难以再次制造“哇哦时刻”。正如视频中所说，Veo 3.1引发的更多是冷静，而非惊叹。

失望情绪从何而来：当迭代更新撞上Sora 2

为什么很多人对Veo 3.1不买账？因为对比对象变了。AI开发者Matt Schumer的评价相当直接：“My initial VO3.1 impression， disappointment.” 他指出，Veo 3.1“不仅明显不如Sora 2，而且价格还更贵”。这句话在社区中被广泛引用，成为这次更新舆论基调的缩影。

但失望未必意味着失败。视频给出的一个关键判断是：问题不在于Veo 3.1做错了什么，而在于它“只是一次迭代更新”。当用户已经习惯了指数级突破，任何线性改进都会被感知为停滞。

VC Justine Moore给出了更宏观的解释。她认为，视频模型已经跨过“够不够好”的门槛，行业正在进入产品时代。她的原话是：“We have entered the product era for video models.” 在这个阶段，更新不再体现在底层能力的巨大飞跃，而是体现在视频延展、角色一致性、可编辑性等“能不能真正用于生产”的细节上。

这也解释了为什么Veo 3.1的亮点是工具，而不是奇迹。它没有赢下社交媒体的热度，却可能更接近真实创作者的工作方式。

从视频到Agent：Claude Haiku 4.5展示另一条进化路径

为什么要把Claude Haiku 4.5放进同一篇讨论？因为它从另一个角度印证了同一趋势：AI不再追求单一最强，而是“合适的组合”。Anthropic发布的Haiku 4.5定位非常清晰——更快、更便宜。

官方给出的数据是：Haiku 4.5速度是Sonnet 4的两倍，成本只有后者的三分之一。更值得注意的是，在swbench verified软件工程测试中，它甚至超过了上一代Sonnet 4，同时在计算机使用任务上也表现更好。这使它成为潜在的“执行型Agent”模型。

Anthropic首席产品官Mike Krieger用一句话点明战略：“We’re giving people a complete agent toolbox.” 在他的设想中，Sonnet负责复杂规划，而Haiku驱动大量高速子代理执行任务。这种分工逻辑，与Veo 3.1强调编辑和流程的思路如出一辙——不是一招制胜，而是系统协作。

值得一提的是，Haiku 4.5将向免费用户开放，用于缓解免费服务的容量压力。这再次说明，模型能力已经足够强，接下来比拼的是如何被规模化使用。

苹果的另一面：当追赶者承受组织震荡

如果说前面的故事展示了产品化的前进，那么苹果的案例则提醒我们：转型并不轻松。视频中提到，苹果又一位高调AI研究员离职，加入了Meta的超级智能团队。

据彭博社Mark Gurman报道，Ruoming Pang在刚被提拔为“答案、知识与信息团队”负责人几周后便选择离开。这个团队原本被视为Siri重大重构的核心，目标是打造类似Perplexity的AI搜索产品，计划于3月发布。

Pang是苹果AI与机器学习体系中最资深的高管之一，而他的离开并非孤例。Gurman指出，今年苹果AI组织已有约十多起离职，且未来数月可能还有更多。他的总结语气颇为严峻：“The continued departures underscore the instability within Apple’s AI ranks.”

这个故事的重要性在于，它揭示了一个被忽略的现实：当OpenAI和Google快速迭代时，传统巨头即便资源雄厚，也可能在组织和节奏上陷入被动。

公众情绪的冷水：技术进步之外的另一条曲线

为什么要关注一项情绪调查？因为它决定了AI能走多远。Pew Research在25个国家的调查显示，34%的受访者对AI“更担忧而非兴奋”，而“更兴奋而非担忧”的比例只有16%。在所有国家中，没有任何一个国家的主流情绪是兴奋。

只有以色列和韩国的兴奋度略高于担忧，美国则位居最担忧的国家之列。视频特别指出，这些数据略早于近期的抗议和负面新闻，因此现实情绪可能更糟。

这与前文形成了微妙呼应：一边是工具越来越成熟，另一边是公众焦虑并未缓解。即便AI工具被广泛使用，信任赤字依然存在。这意味着，产品化不仅是技术问题，也是社会沟通问题。

总结

从Veo 3.1的冷静发布，到Claude Haiku 4.5的角色分工，再到苹果的人才流失与公众情绪的转冷，这期视频串起了一条清晰主线：AI正在告别“炫技时代”，进入真正的产品与组织能力竞争。对从业者而言，下一阶段的优势不在于模型多强，而在于是否理解真实流程、成本结构与社会接受度。

关键词： Veo 3.1， Sora 2， AI视频生成， Claude Haiku 4.5， AI产品化

事实核查备注：关键事实包括：Veo 3.1功能更新（参考图像、对象移除、首尾帧补全、视频延展）；Veo V3发布时间为2025年5月；Matt Schumer与Justine Moore的原话引用；Claude Haiku 4.5速度与成本对比（两倍速度，三分之一成本）；swbench verified测试；Ruoming Pang离职及Mark Gurman报道；Pew Research在25国调查的数据比例。

返回文章列表