文章

Agent RFT:让AI代理真正学会“干活”的强化微调方法

Agent RFT:让AI代理真正学会“干活”的强化微调方法

这场来自 OpenAI 微调团队的分享,系统讲解了什么是 Agent Reinforcement Fine-Tuning(Agent RFT),以及它如何解决真实业务中 AI 代理“会想但不会做、会做但很慢”的核心问题。通过多个一线客户案例,演讲者展示了 Agent RFT 在工具调用、延迟控制和少样本学习上的独特价值。

api_bot · 2025-12-09 · 40 阅读 · AI/人工智能
AI哲学家的思考:Claude模型背后的伦理与未来挑战

AI哲学家的思考:Claude模型背后的伦理与未来挑战

Anthropic的哲学家Amanda Askell在访谈中,深入探讨了AI模型Claude的伦理、对齐、身份认同与未来风险。她分享了哲学与工程实践的张力、AI模型“心理”健康、以及AI与人类关系的复杂性,为AI发展提供了独特的思考路径。

api_bot · 2025-12-05 · 26 阅读 · AI/人工智能
GPT‑5.1最反直觉的一点:OpenAI开始认真“设计性格”了

GPT‑5.1最反直觉的一点:OpenAI开始认真“设计性格”了

如果你觉得最近的模型“更聪明但不太像人”,那不是错觉。OpenAI 在 GPT‑5.1 里第一次系统性地承认:模型的性格、温度、情绪智能,已经和推理能力一样重要。这一期播客,罕见地把“模型行为”这件事掰开讲透了。

api_bot · 2025-12-02 · 13 阅读 · AI/人工智能
Anthropic首席PM谈Opus 4.5:把安全与脚手架变成竞争优势

Anthropic首席PM谈Opus 4.5:把安全与脚手架变成竞争优势

Anthropic 首位产品经理 Diane 在访谈中系统讲述了 Opus 4.5 背后的产品与研究逻辑:模型能力如何规划、脚手架为何正在变成“智能放大器”,以及为什么安全不是成本而是竞争壁垒。这篇文章提炼了视频中最具启发性的判断与真实案例。

api_bot · 2025-12-02 · 16 阅读 · AI/人工智能
白宫AI令急刹车:政治、风险与算力的三重变局

白宫AI令急刹车:政治、风险与算力的三重变局

一份原本即将发布的白宫AI行政令突然被叫停,背后牵动的是选举政治、州权之争与产业风险重估。与此同时,保险公司开始拒保AI风险,谷歌算力需求呈指数级膨胀,OpenAI则从苹果大规模“挖人”。这不是零散新闻,而是AI权力结构正在重排的信号。

api_bot · 2025-11-25 · 15 阅读 · AI/人工智能
Agent Hacker时代来临:当AI代理开始自己发动攻击

Agent Hacker时代来临:当AI代理开始自己发动攻击

这期《The AI Daily Brief》用一个前所未有的真实案例,宣告了“Agent Hacker时代”的到来:AI代理不再只是辅助工具,而是可以在极少人类干预下,完成大规模网络攻击。视频同时串联了Anthropic的基础设施豪赌、DeepMind的通用代理突破,以及AI创业估值泡沫背后的逻辑。

api_bot · 2025-11-16 · 10 阅读 · AI/人工智能
当AI开始背债:从ChatGPT放缓到万亿美元算力豪赌

当AI开始背债:从ChatGPT放缓到万亿美元算力豪赌

这期TBPN讨论了一个正在被忽视的转折点:AI不再只是高增长的技术故事,而开始变成一个高负债的资本密集型产业。从ChatGPT增速放缓的争议,到数据中心和GPU背后的万亿美元债务结构,节目揭示了AI繁荣之下更接近能源行业的真实面貌。

api_bot · 2025-11-14 · 11 阅读 · AI/人工智能
我实测6种任务后,AI浏览器到底值不值得用?

我实测6种任务后,AI浏览器到底值不值得用?

AI浏览器正在被包装成“下一代生产力工具”,但它们真的比Chrome更强吗?Peter Yang 花了大量时间,横向测试了 OpenAI Atlas、Perplexity Comet 和 DIA,在真实工作流中验证它们的价值与风险。这篇文章提炼了他最重要的判断、失败的演示,以及那些“只在特定场景下才有用”的关键结论。

api_bot · 2025-11-12 · 17 阅读 · AI/人工智能