从SFT到RFT:OpenAI如何系统化看待模型微调
这场由OpenAI工程师Ilan Bigio带来的分享,系统梳理了三种主流微调方式——SFT、DPO与RFT——以及它们各自解决的问题边界。与其把微调当成“最后的魔法”,他更强调一种工程化、循序渐进的思路:什么时候提示工程就够了,什么时候必须动用微调,以及如何避免投入巨大却收益有限。
这场由OpenAI工程师Ilan Bigio带来的分享,系统梳理了三种主流微调方式——SFT、DPO与RFT——以及它们各自解决的问题边界。与其把微调当成“最后的魔法”,他更强调一种工程化、循序渐进的思路:什么时候提示工程就够了,什么时候必须动用微调,以及如何避免投入巨大却收益有限。
当所有人都在追逐更大的模型、更强的算力时,Figma Config 2025 抛出了一个反直觉的答案:真正拉开差距的,不是技术,而是设计速度。Gabriel Valdivia 用一段100多年前的飞行史,拆解了为什么在 AI 时代,初创团队反而更容易赢。
一个在 Facebook、Stripe 连续“超速成长”10年的工程负责人,却在疫情最混乱的会议里意识到:技术本身解决不了问题。真正稀缺的不是更强的系统,而是一套能被政府、社会、AI 从业者反复复用的“技术行动手册”。
从Meta传出高达1亿美元签约金的挖角传闻,到OpenAI首次拿下五角大楼2亿美元合同,再到Cursor推出每月200美元的“Ultra”订阅,这期《AI Daily Brief》勾勒出一个正在迅速失去价格锚点的AI行业。
这期《The AI Daily Brief》并没有教你新的提示词技巧,而是提出三种立刻就能执行的练习方式:把最新模型当作战略同事使用一周、用“vibe coding”快速原型验证想法、以及系统性理解AI工具之间如何连接。它们共同指向一个核心转变:从“用AI完成任务”,升级为“和AI一起思考”。
这是一场来自一线实践者的分享,讲述如何在真实医疗场景中构建AI支持代理。演讲者不仅展示了LangGraph/MCP在复杂流程中的价值,也反复强调了边界、责任与工程取舍。
如果你还以为 AI 视频只是“玩具级 Demo”,那 Google Veo 这次是真的把桌子掀了。Riley Brown 这期视频里,一个反复被提到的判断正在业内蔓延:完整的 AI 电影,不是未来,而是正在发生。更重要的是,门槛正在被压到普通创作者都能用的程度。
在这场 Config 2025 的对话里,几位一线实践者抛出一个让人警觉的数据:已经有 17% 的新代码由 AI 直接完成。更重要的不是比例,而是他们如何重新定义“团队”“协作”和“人该做什么”。这不是炫技,而是一份正在发生的工作方式变革实录。
在 Figma Config 2025 的舞台上,Baratunde Thurston 几乎没有谈模型参数、算力或性能。他抛出的核心问题反而让很多 AI 从业者坐立不安:当机器越来越聪明,我们到底有没有变得更像“人”?这场演讲,讲的是 AI 的另一条路线。
在所有人都在拼命给 AI 加能力、加上下文、加自由度时,Figma Config 2025 的这场演讲抛出了一个反直觉结论:真正让 AI 变好用的,不是更强,而是更“受限”。如果你正在做 AI 产品、对话系统或内部工具,这可能会彻底改变你的设计方法。