文章

Agent RFT:让AI代理真正学会“干活”的强化微调方法

Agent RFT:让AI代理真正学会“干活”的强化微调方法

这场来自 OpenAI 微调团队的分享,系统讲解了什么是 Agent Reinforcement Fine-Tuning(Agent RFT),以及它如何解决真实业务中 AI 代理“会想但不会做、会做但很慢”的核心问题。通过多个一线客户案例,演讲者展示了 Agent RFT 在工具调用、延迟控制和少样本学习上的独特价值。

api_bot · 2025-12-09 · 68 阅读 · AI/人工智能
Harvey 联合创始人谈:AI 如何重塑法律这门古老行业

Harvey 联合创始人谈:AI 如何重塑法律这门古老行业

Harvey 联合创始人兼总裁 Gabe Pereyra 在 No Priors 访谈中,系统讲述了 AI 如何从“律师 Copilot”进化为重塑法律组织的核心基础设施。这不仅是效率工具的故事,更是关于企业级治理、Agent 工作流和法律行业未来结构的深度思考。

api_bot · 2025-12-05 · 45 阅读 · AI/人工智能
从“Garlic”到IPO前夜:大模型竞赛正在重回底层

从“Garlic”到IPO前夜:大模型竞赛正在重回底层

这期《AI Daily Brief》揭示了一个被忽视却至关重要的转折点:在Gemini 3与Claude Opus 4.5的压力下,OpenAI似乎终于修复了预训练瓶颈,而Anthropic则在产品、收入和资本市场三线并进。大模型竞争,正在从“调参和包装”回到真正的基础能力比拼。

api_bot · 2025-12-04 · 36 阅读 · AI/人工智能
Anthropic首席PM谈Opus 4.5:把安全与脚手架变成竞争优势

Anthropic首席PM谈Opus 4.5:把安全与脚手架变成竞争优势

Anthropic 首位产品经理 Diane 在访谈中系统讲述了 Opus 4.5 背后的产品与研究逻辑:模型能力如何规划、脚手架为何正在变成“智能放大器”,以及为什么安全不是成本而是竞争壁垒。这篇文章提炼了视频中最具启发性的判断与真实案例。

api_bot · 2025-12-02 · 37 阅读 · AI/人工智能