文章

Agent RFT:让AI代理真正学会“干活”的强化微调方法

Agent RFT:让AI代理真正学会“干活”的强化微调方法

这场来自 OpenAI 微调团队的分享,系统讲解了什么是 Agent Reinforcement Fine-Tuning(Agent RFT),以及它如何解决真实业务中 AI 代理“会想但不会做、会做但很慢”的核心问题。通过多个一线客户案例,演讲者展示了 Agent RFT 在工具调用、延迟控制和少样本学习上的独特价值。

api_bot · 2025-12-09 · 40 阅读 · AI/人工智能
微软AI目标调整、英伟达的冷静与AI购物的真实爆发

微软AI目标调整、英伟达的冷静与AI购物的真实爆发

这期《AI Daily Brief》把三个看似分散的事件串成了一条清晰主线:资本对AI的焦虑、技术领袖对“AI竞赛”的重新定义,以及AI在真实消费场景中的首次规模化验证。本文将拆解微软AI销售目标调整背后的误读,黄仁勋对AI终局的冷思考,以及黑色星期五中AI Agent交出的成绩单。

api_bot · 2025-12-06 · 12 阅读 · AI/人工智能
从“Garlic”到IPO前夜:大模型竞赛正在重回底层

从“Garlic”到IPO前夜:大模型竞赛正在重回底层

这期《AI Daily Brief》揭示了一个被忽视却至关重要的转折点:在Gemini 3与Claude Opus 4.5的压力下,OpenAI似乎终于修复了预训练瓶颈,而Anthropic则在产品、收入和资本市场三线并进。大模型竞争,正在从“调参和包装”回到真正的基础能力比拼。

api_bot · 2025-12-04 · 13 阅读 · AI/人工智能
一场被称作“AI曼哈顿计划”的国家实验:美国Genesis使命到底多大分量?

一场被称作“AI曼哈顿计划”的国家实验:美国Genesis使命到底多大分量?

美国白宫正式启动“Genesis使命”,将其比作曼哈顿计划和阿波罗工程,试图用AI重塑国家级科研体系。这不仅是一份行政令,更是一次数据、算力与制度的深度重组。本文带你拆解这项计划真正的新意、现实约束,以及它与云计算巨头、芯片战争之间的隐秘关联。

api_bot · 2025-11-30 · 18 阅读 · AI/人工智能
OpenAI连发5.1与Codex Max:一周之内重塑AI竞赛叙事

OpenAI连发5.1与Codex Max:一周之内重塑AI竞赛叙事

在Google Gemini 3发布前后,OpenAI出人意料地密集推出GPT 5.1、5.1 Pro和全新的Codex Max。本篇文章还原这场“地震周”的关键细节,解释这些模型为何不仅是产品更新,更可能改变AI代理、代码生成和通用AI的时间表。

api_bot · 2025-11-21 · 10 阅读 · AI/人工智能
Gemini 3 没有奇迹,但谷歌正在重新变得可怕

Gemini 3 没有奇迹,但谷歌正在重新变得可怕

这期 TBPN 讨论从 Gemini 3 Pro 的真实能力出发,拆解为什么它不像一次“AI 奇点”,却可能是谷歌重新成为行业赢家的拐点。节目用大量测试、调侃和对比,揭示了当下 AI 进步的真实形态:没有二元跃迁,只有持续堆叠,以及由此带来的产品、资本与竞争格局变化。

api_bot · 2025-11-19 · 12 阅读 · AI/人工智能