文章

他把 Claude 变成“AI 员工”:不是玩具,而是真正能交付工作的智能体

他把 Claude 变成“AI 员工”:不是玩具,而是真正能交付工作的智能体

大多数 AI Agent 都停留在“能聊天”,而 Riley Brown 直接把 Claude Code 训练成了一个能长期记忆、自动归档、反复协作的“AI 员工”。更反直觉的是:核心不是模型多强,而是一个被严重低估的 README 工作流。

api_bot · 2025-12-10 · 14 阅读 · AI/人工智能
Agent RFT:让AI代理真正学会“干活”的强化微调方法

Agent RFT:让AI代理真正学会“干活”的强化微调方法

这场来自 OpenAI 微调团队的分享,系统讲解了什么是 Agent Reinforcement Fine-Tuning(Agent RFT),以及它如何解决真实业务中 AI 代理“会想但不会做、会做但很慢”的核心问题。通过多个一线客户案例,演讲者展示了 Agent RFT 在工具调用、延迟控制和少样本学习上的独特价值。

api_bot · 2025-12-09 · 40 阅读 · AI/人工智能
AI真能替代12%的工作吗?MIT与Anthropic给出的不同答案

AI真能替代12%的工作吗?MIT与Anthropic给出的不同答案

围绕“AI是否已经能替代12%工作”的争议,MIT的Project Iceberg研究与Anthropic内部实践给出了远比标题党复杂的答案。这篇文章拆解11.7%这一数字的真实含义,并结合Anthropic工程师的一线经验,理解AI如何在任务、技能而非岗位层面,悄然重塑工作本身。

api_bot · 2025-12-05 · 13 阅读 · AI/人工智能
从“Garlic”到IPO前夜:大模型竞赛正在重回底层

从“Garlic”到IPO前夜:大模型竞赛正在重回底层

这期《AI Daily Brief》揭示了一个被忽视却至关重要的转折点:在Gemini 3与Claude Opus 4.5的压力下,OpenAI似乎终于修复了预训练瓶颈,而Anthropic则在产品、收入和资本市场三线并进。大模型竞争,正在从“调参和包装”回到真正的基础能力比拼。

api_bot · 2025-12-04 · 14 阅读 · AI/人工智能
Anthropic首席PM谈Opus 4.5:把安全与脚手架变成竞争优势

Anthropic首席PM谈Opus 4.5:把安全与脚手架变成竞争优势

Anthropic 首位产品经理 Diane 在访谈中系统讲述了 Opus 4.5 背后的产品与研究逻辑:模型能力如何规划、脚手架为何正在变成“智能放大器”,以及为什么安全不是成本而是竞争壁垒。这篇文章提炼了视频中最具启发性的判断与真实案例。

api_bot · 2025-12-02 · 17 阅读 · AI/人工智能
Claude Opus 4.5 刚发布3天,就把程序员的主力模型换掉了

Claude Opus 4.5 刚发布3天,就把程序员的主力模型换掉了

三天前,开发者还在吹 Gemini 3 Pro;三天后,很多人已经悄悄换成了 Claude Opus 4.5。不是跑分噱头,而是真实项目、真实代码、真实 PR 的碾压级体验。这篇文章告诉你:为什么 Opus 4.5 会成为很多人眼里的“唯一主力模型”,以及它真正该怎么用。

api_bot · 2025-11-28 · 10 阅读 · AI/人工智能
OpenAI连发5.1与Codex Max:一周之内重塑AI竞赛叙事

OpenAI连发5.1与Codex Max:一周之内重塑AI竞赛叙事

在Google Gemini 3发布前后,OpenAI出人意料地密集推出GPT 5.1、5.1 Pro和全新的Codex Max。本篇文章还原这场“地震周”的关键细节,解释这些模型为何不仅是产品更新,更可能改变AI代理、代码生成和通用AI的时间表。

api_bot · 2025-11-21 · 11 阅读 · AI/人工智能