Anthropic 没预热、没通稿,却悄悄放出 Opus 4.7:一场只看“感觉”的模型发布
正在加载视频...
视频章节
Opus 4.7 没有发布会、没有指标狂欢,甚至连提前简报都没有——Every 团队是在一场混乱的直播里,边掉麦、边跑 benchmark、边写投资人更新,硬生生把 Anthropic 最新模型“用”出来的。这不是一次发布解读,而是一场罕见的模型即工具的现场验收。
Anthropic 没预热、没通稿,却悄悄放出 Opus 4.7:一场只看“感觉”的模型发布
Opus 4.7 没有发布会、没有指标狂欢,甚至连提前简报都没有——Every 团队是在一场混乱的直播里,边掉麦、边跑 benchmark、边写投资人更新,硬生生把 Anthropic 最新模型“用”出来的。这不是一次发布解读,而是一场罕见的模型即工具的现场验收。
最反常的发布:Anthropic 什么都没说,但所有人都在测试
如果你习惯了 OpenAI 式的发布节奏:预告、博客、指标图表、对齐宣言,那 Opus 4.7 会让你非常不适应。Anthropic 几乎是“静默”上线了新模型,Every 甚至在直播里半开玩笑地说了一句:“Anthropic snubbed us.”——他们没拿到提前版本。
于是这场直播从一开始就不像发布会,更像真实世界:麦克风出问题、反复确认“你能听到我吗”,然后直接一句“我们在做 Opus 4.7 的 vibe check”。这句话奠定了基调——今天不聊 PPT,只聊感觉。
这种反常本身就是信号。Anthropic 似乎默认:真正懂行的人,不需要被教育模型有多强,他们会自己上手。于是我们看到的不是结论,而是过程:打开 Claude、并排放 4.6 和 4.7、把真实工作丢进去,看它会不会翻车。
没有 AGI 口号,只有一句让人安心的话:你的加密还安全
整场直播里最“硬”的一句话,反而出现在很早的地方:“your cryptography is safe.” 在 SweetBench Pro 等 benchmark 提到性能提升时,主持人立刻补了一句确认——“We’re still safe.”
这不是随口一说。对很多 AI 从业者来说,模型升级最隐秘的焦虑不是性能,而是能力溢出:会不会突然对安全假设产生冲击?会不会在密码学、逆向、攻击面上出现质变?
Opus 4.7 给出的信号是:能力在爬,但边界还在。没有炫耀突破,也没有回避风险,只是很工程师式地告诉你——这次升级,没有动到那条线。这种克制,反而比任何“我们很安全”的长文更有说服力。
真正的测试,不是 benchmark,是投资人更新
直播中最精彩的部分,不是跑分,而是一个看似普通的任务:让 Opus 4.7 写 Every 的 investor update。
这是一个极其“阴险”的测试。投资人更新既不是营销文,也不是技术文档,它要求模型同时做到:事实准确、语气克制、结构清晰、对内部语境有感觉。更关键的是——它不能胡说。
他们直接把任务丢进 Claude,看它能不能在 loop 里反复迭代,逐步逼近可用版本。过程中出现了“weird response”,也有明显比 4.6 更稳的段落。主持人的评价很克制,但一句“This is good.”已经说明问题。
这类测试的价值在于:它绕开了所有模型厂商最擅长优化的公开 benchmark,直击知识工作者每天最头疼的那类写作。Opus 4.7 在这里的表现,至少说明一件事:它更像一个可以共事的同事,而不是一个需要你不断兜底的实习生。
4.6 对 4.7 的并排对决:差距不在聪明,而在“不出戏”
在 4.6 放左边、4.7 放右边的对比中,有一个很微妙的变化被反复提到:Opus 4.7 更少“打断氛围”。
不是更会答题,也不是更会炫技,而是在长任务里更少突然变得奇怪——语气不跳、结构不散、不会莫名其妙换人格。这也是为什么他们反复用“vibe”这个词。
你可以把它理解为:4.7 的改进,更像是内部一致性的提升,而不是智商的暴涨。对真正把模型接进 workflow 的团队来说,这是质变。因为大多数 AI 应用失败,不是死在能力上,而是死在不可预测性上。
从 Slack 到 Agent:他们已经在用 4.7 做什么
直播后半段的信息密度很高,但如果提炼一个关键词,就是“agents”。他们提到用模型去读 Slack、做 co-work、参与持续任务,而不是一次性问答。
这也解释了为什么他们对 Opus 4.7 的评价集中在“solidity”“reliability”这些词上。当模型开始被当作系统组件,而不是聊天对象时,最重要的能力就变成了:你敢不敢把它放进生产环境。
值得注意的是,他们没有给出完整的 agent 架构细节,也没有画饼,只是很随意地提到:March 是他们最强的一个月,而 Claude 已经深度参与其中。这种轻描淡写,反而比任何成功案例分享都更真实。
这不是一场发布会,而是一种趋势的预演
接近尾声时,有人提到“the great convergence”。模型、工具、工作流、订阅体系,正在一点点黏在一起。
Opus 4.7 的发布方式,某种程度上就是这种趋势的缩影:模型不再需要被解释,它只需要被使用。真正的评判权,从发布博客转移到了每一个真实任务里。
当主持人说“you should expect all your old prompts…”时,潜台词其实很清楚:升级不会拯救糟糕的使用方式,但一个更稳的模型,会放大好 workflow 的价值。
总结
如果你是 AI 从业者,Opus 4.7 最值得关注的不是“提升了多少”,而是它代表了一种成熟路径:不追逐戏剧性突破,而是持续降低使用摩擦。对团队来说,这意味着可以更大胆地把模型接进核心流程;对个人来说,这意味着你应该开始用真实工作,而不是测试题,去评估模型。真正的竞争,正在从模型参数,转移到谁更懂得“怎么一起工作”。
关键词: Opus 4.7, Claude, Anthropic, AI 工作流, Agent
事实核查备注: 需要核查:1)Opus 4.7 的正式发布时间是否为 2026-04-16;2)SweetBench Pro 的具体提升幅度是否有公开数据;3)“your cryptography is safe”是否为原话语境下的准确引用;4)Every 团队是否确实未获得 Opus 4.7 的提前访问;5)March 为 Every 最强月份的具体指标口径。