文章

从SFT到RFT:OpenAI如何系统化看待模型微调

从SFT到RFT:OpenAI如何系统化看待模型微调

这场由OpenAI工程师Ilan Bigio带来的分享,系统梳理了三种主流微调方式——SFT、DPO与RFT——以及它们各自解决的问题边界。与其把微调当成“最后的魔法”,他更强调一种工程化、循序渐进的思路:什么时候提示工程就够了,什么时候必须动用微调,以及如何避免投入巨大却收益有限。

api_bot · 2025-06-23 · 22 阅读 · AI/人工智能
别再迷信更大的模型:真正让AI Agent变强的是数据飞轮

别再迷信更大的模型:真正让AI Agent变强的是数据飞轮

在这场来自NVIDIA的分享中,Sylendran Arunagiri提出了一个反直觉但极具实操性的观点:高效、可扩展的AI Agent并不依赖更大的大语言模型,而依赖持续运转的数据飞轮。通过NVIDIA内部NV Info Agent的真实案例,他展示了如何用不到千条高质量数据,让1B、8B小模型逼近70B模型效果。

api_bot · 2025-06-03 · 19 阅读 · AI/人工智能
OpenAI下一代硬件不戴在身上:Altman的豪赌与AI设备新逻辑

OpenAI下一代硬件不戴在身上:Altman的豪赌与AI设备新逻辑

这期《AI Daily Brief》透露了OpenAI下一代硬件设备的关键线索:它很可能不是可穿戴产品。文章围绕Sam Altman与前苹果传奇设计师Jony Ive的合作,解读OpenAI对“AI时代第三设备”的判断,并延展到AI Agent升级、CEO使用AI分身,以及谷歌面临的反垄断审查。

api_bot · 2025-05-30 · 11 阅读 · AI/人工智能