Veo 3.1登场:当AI视频从“震撼演示”走向“可用产品”
正在加载视频...
视频章节
Google发布Veo 3.1,却未能复制V3时期的惊艳时刻。视频模型的竞争焦点,正在从“谁更逼真”转向“谁更好用”。本文通过Veo 3.1、Sora 2、Claude Haiku 4.5与苹果AI动荡等故事,梳理AI产业进入产品化阶段的真实信号。
Veo 3.1登场:当AI视频从“震撼演示”走向“可用产品”
Google发布Veo 3.1,却未能复制V3时期的惊艳时刻。视频模型的竞争焦点,正在从“谁更逼真”转向“谁更好用”。本文通过Veo 3.1、Sora 2、Claude Haiku 4.5与苹果AI动荡等故事,梳理AI产业进入产品化阶段的真实信号。
Veo 3.1:不是更强的魔法,而是更完整的工具箱
为什么Veo 3.1重要?因为它标志着AI视频竞争逻辑的变化。Google在发布中强调,Veo 3.1提升了输出真实感、提示词遵循度和音频质量,但真正的重头戏并不在画质,而在“编辑能力”。
这次更新中,用户可以引入参考图片来固定角色或物体,也可以直接要求模型从已有视频中“移除某个对象”。更进一步,创作者可以提供视频的第一帧和最后一帧,让模型自动补全中间内容;或者基于最后几帧延展视频,从而把多个短片无缝拼接成接近一分钟的短视频。这些功能看似不炫技,却直指真实创作流程中的痛点。
回顾背景更能理解这种转向。Veo V3在2025年5月发布时,被称为“AI视频的分水岭”,首次实现了音画同步,并在真实感上达到当时的顶尖水准。但5个月过去,行业环境已经完全不同。Sora 2、Runway等产品快速跟进,单纯提升模型能力已难以再次制造“哇哦时刻”。正如视频中所说,Veo 3.1引发的更多是冷静,而非惊叹。
失望情绪从何而来:当迭代更新撞上Sora 2
为什么很多人对Veo 3.1不买账?因为对比对象变了。AI开发者Matt Schumer的评价相当直接:“My initial VO3.1 impression, disappointment.” 他指出,Veo 3.1“不仅明显不如Sora 2,而且价格还更贵”。这句话在社区中被广泛引用,成为这次更新舆论基调的缩影。
但失望未必意味着失败。视频给出的一个关键判断是:问题不在于Veo 3.1做错了什么,而在于它“只是一次迭代更新”。当用户已经习惯了指数级突破,任何线性改进都会被感知为停滞。
VC Justine Moore给出了更宏观的解释。她认为,视频模型已经跨过“够不够好”的门槛,行业正在进入产品时代。她的原话是:“We have entered the product era for video models.” 在这个阶段,更新不再体现在底层能力的巨大飞跃,而是体现在视频延展、角色一致性、可编辑性等“能不能真正用于生产”的细节上。
这也解释了为什么Veo 3.1的亮点是工具,而不是奇迹。它没有赢下社交媒体的热度,却可能更接近真实创作者的工作方式。
从视频到Agent:Claude Haiku 4.5展示另一条进化路径
为什么要把Claude Haiku 4.5放进同一篇讨论?因为它从另一个角度印证了同一趋势:AI不再追求单一最强,而是“合适的组合”。Anthropic发布的Haiku 4.5定位非常清晰——更快、更便宜。
官方给出的数据是:Haiku 4.5速度是Sonnet 4的两倍,成本只有后者的三分之一。更值得注意的是,在swbench verified软件工程测试中,它甚至超过了上一代Sonnet 4,同时在计算机使用任务上也表现更好。这使它成为潜在的“执行型Agent”模型。
Anthropic首席产品官Mike Krieger用一句话点明战略:“We’re giving people a complete agent toolbox.” 在他的设想中,Sonnet负责复杂规划,而Haiku驱动大量高速子代理执行任务。这种分工逻辑,与Veo 3.1强调编辑和流程的思路如出一辙——不是一招制胜,而是系统协作。
值得一提的是,Haiku 4.5将向免费用户开放,用于缓解免费服务的容量压力。这再次说明,模型能力已经足够强,接下来比拼的是如何被规模化使用。
苹果的另一面:当追赶者承受组织震荡
如果说前面的故事展示了产品化的前进,那么苹果的案例则提醒我们:转型并不轻松。视频中提到,苹果又一位高调AI研究员离职,加入了Meta的超级智能团队。
据彭博社Mark Gurman报道,Ruoming Pang在刚被提拔为“答案、知识与信息团队”负责人几周后便选择离开。这个团队原本被视为Siri重大重构的核心,目标是打造类似Perplexity的AI搜索产品,计划于3月发布。
Pang是苹果AI与机器学习体系中最资深的高管之一,而他的离开并非孤例。Gurman指出,今年苹果AI组织已有约十多起离职,且未来数月可能还有更多。他的总结语气颇为严峻:“The continued departures underscore the instability within Apple’s AI ranks.”
这个故事的重要性在于,它揭示了一个被忽略的现实:当OpenAI和Google快速迭代时,传统巨头即便资源雄厚,也可能在组织和节奏上陷入被动。
公众情绪的冷水:技术进步之外的另一条曲线
为什么要关注一项情绪调查?因为它决定了AI能走多远。Pew Research在25个国家的调查显示,34%的受访者对AI“更担忧而非兴奋”,而“更兴奋而非担忧”的比例只有16%。在所有国家中,没有任何一个国家的主流情绪是兴奋。
只有以色列和韩国的兴奋度略高于担忧,美国则位居最担忧的国家之列。视频特别指出,这些数据略早于近期的抗议和负面新闻,因此现实情绪可能更糟。
这与前文形成了微妙呼应:一边是工具越来越成熟,另一边是公众焦虑并未缓解。即便AI工具被广泛使用,信任赤字依然存在。这意味着,产品化不仅是技术问题,也是社会沟通问题。
总结
从Veo 3.1的冷静发布,到Claude Haiku 4.5的角色分工,再到苹果的人才流失与公众情绪的转冷,这期视频串起了一条清晰主线:AI正在告别“炫技时代”,进入真正的产品与组织能力竞争。对从业者而言,下一阶段的优势不在于模型多强,而在于是否理解真实流程、成本结构与社会接受度。
关键词: Veo 3.1, Sora 2, AI视频生成, Claude Haiku 4.5, AI产品化
事实核查备注: 关键事实包括:Veo 3.1功能更新(参考图像、对象移除、首尾帧补全、视频延展);Veo V3发布时间为2025年5月;Matt Schumer与Justine Moore的原话引用;Claude Haiku 4.5速度与成本对比(两倍速度,三分之一成本);swbench verified测试;Ruoming Pang离职及Mark Gurman报道;Pew Research在25国调查的数据比例。