Anthropic首席PM谈Opus 4.5：把安全与脚手架变成竞争优势

AI PM 编辑部 · 2025年12月02日 · 16 阅读 · AI/人工智能

强化学习 AI安全模型部署推理通用人工智能代码生成 AI应用 AI Agent Token Claude

正在加载视频...

视频章节

Anthropic 首位产品经理 Diane 在访谈中系统讲述了 Opus 4.5 背后的产品与研究逻辑：模型能力如何规划、脚手架为何正在变成“智能放大器”，以及为什么安全不是成本而是竞争壁垒。这篇文章提炼了视频中最具启发性的判断与真实案例。

Anthropic首席PM谈Opus 4.5：把安全与脚手架变成竞争优势

Anthropic 首位产品经理 Diane 在访谈中系统讲述了 Opus 4.5 背后的产品与研究逻辑：模型能力如何规划、脚手架为何正在变成“智能放大器”，以及为什么安全不是成本而是竞争壁垒。这篇文章提炼了视频中最具启发性的判断与真实案例。

从能力路线图出发，而不是从模型版本出发

为什么重要：大模型发布节奏越来越快，但真正拉开差距的不是版本号，而是对“能力”的长期规划。Diane 在访谈一开始就强调，Anthropic 内部讨论的核心从来不是“下一个模型叫啥”，而是指令跟随、编程、记忆等关键能力是否在持续进化。

她回顾了 Claude 各代模型的演进方式：每一代模型都是某些能力的“阶段性载体”，而不是一次性完成所有目标。她提到，指令跟随决定了模型是否可信，编程能力决定了它是否能成为生产力工具，而记忆能力则直接关系到长期代理和复杂任务是否可行。她在访谈中形容这种方式“大意是：模型只是外壳，真正要交付的是能力本身”。

这种能力导向的路线图，也解释了为什么 Anthropic 对基准成绩保持克制态度。基准测试被视为信号而非终点，真正的检验来自用户是否能在真实工作流中完成过去做不到的事。

当用户用错方式时，反而揭示了模型的潜力

为什么重要：许多关键产品机会，并不是在规划阶段被预测到的，而是从用户的“意外使用”中浮现。Diane 分享了一个让团队印象深刻的现象：大量用户开始用 Claude 处理 Excel 和 PowerPoint 相关任务。

这并非 Anthropic 最初的重点场景，但用户会让 Claude 生成公式、重构表格逻辑，甚至直接产出可用的演示结构。团队意识到，这背后并不是简单的文本生成，而是模型在结构化推理、代码与自然语言混合处理上的成熟度提升。她提到，看到这些用法时，团队的反应不是“这是不是偏离定位”，而是“哪些底层能力已经足够稳定，可以加倍投入”。

她在访谈中总结道：“用户永远会比路线图更早发现价值。”这也成为 Anthropic 调整评测指标和训练重点的重要输入来源。

‘加倍投入’如何落地：把产品管理方法带进模型训练

为什么重要：大模型研发常被视为纯研究问题，但 Diane 反复强调，它与传统产品管理的相似性远超外界想象。所谓‘加倍投入’，并不是简单增加算力，而是从用户愿景出发，层层拆解到可度量的指标。

在 Anthropic 的流程中，一个模糊的用户目标会被转化为具体评测，再进一步映射到强化学习（RL）策略和数据改进方向。她解释说，这个过程很像产品经理把用户需求转化为功能规格，只不过这里的“功能”是模型行为分布。她用一句话概括这种思路：“如果你量化不了它，就很难系统性地改进它。”

这种方法也让研究团队与产品团队的边界变得模糊。模型训练不再是独立阶段，而是持续围绕真实使用反馈进行的循环。

Opus 4.5 的跃迁：当多种能力叠加在一起

为什么重要：单点能力提升往往难以感知，但当多项能力同时成熟，用户会体验到质变。Diane 认为，Opus 4.5 的突破正来自这种叠加效应。

她重点提到三类场景：复杂代理编程、长时间迭代任务，以及计算机使用（computer use）。在这些任务中，模型需要持续理解上下文、生成和修改代码，并在失败后自我修正。Opus 4.5 在这些场景中的稳定性提升，让“同步代理”和“长跑型任务”开始具备实际可用性。

关于计算机使用，Anthropic 采取了阶段性策略：先在受限环境中验证可靠性，再逐步走向更开放的浏览器代理。她在访谈中直言，这类能力“不是炫技，而是通向更大应用空间的门票”。

成本、安全与脚手架：被低估的竞争优势

为什么重要：当模型能力趋同，真正影响采用的是成本结构与信任基础。Diane 在定价讨论中特别强调，不要只看 token 价格，而要看端到端完成任务的总成本。

Opus 4.5 引入的 effort 参数，允许用户在质量与效率之间做权衡。她认为，模型厂商有责任帮助开发者理解不同模型层级和效率差异，而不是让他们在不透明的成本中试错。她提到，许多早期企业客户反馈，虽然单次调用看似更贵，但整体任务准确率提升，反而降低了人力和返工成本。

在安全问题上，她给出了 Anthropic 的核心判断：“安全不是刹车，而是方向盘。”脚手架（scaffolding）也不再只是训练阶段的辅助工具，而是逐渐演变成放大模型智能的长期机制。

总结

这次访谈最有价值的地方，不在于 Opus 4.5 的某个具体指标，而在于 Anthropic 展现的一整套思维方式：以能力为核心的长期路线图、从用户意外用法中反推机会、用产品管理方法做模型训练，以及把安全与脚手架视为竞争优势。对开发者和创业者而言，这提醒我们，大模型时代真正的壁垒，往往藏在看似“非技术”的选择里。

关键词： Anthropic， Opus 4.5， Claude， AI Agent， AI安全

事实核查备注：视频人物：Diane（Anthropic 首位 PM、研究产品负责人）；公司：Anthropic；产品与模型：Claude、Opus 4.5；关键概念：强化学习（RL）、AI Agent、computer use、token 成本、effort 参数、模型脚手架（scaffolding）。

返回文章列表