你的 AI Agent 不只会写代码了,它已经能替你训练模型
如果你还以为“训练模型”是工程师的专属技能,那你已经落后了一代。Hugging Face 开源团队的 Merve Noyan 在这场演讲里抛出一个足够炸裂的事实:今天的 AI Agent,不只是用模型,而是能自己选模型、配显存、跑任务,甚至替你把模型训好。
如果你还以为“训练模型”是工程师的专属技能,那你已经落后了一代。Hugging Face 开源团队的 Merve Noyan 在这场演讲里抛出一个足够炸裂的事实:今天的 AI Agent,不只是用模型,而是能自己选模型、配显存、跑任务,甚至替你把模型训好。
OpenAI 刚刚把 Codex 从“会写代码的助手”,升级成“会用你电脑的同事”。它不抢鼠标、不录屏,却能同时操作多个应用,甚至比人类更快。这不是炫技,而是工作方式的分水岭。
几乎所有公司都在做 GenAI,但 95% 的项目连生产环境都进不去。前 Falcon 核心成员、Adaptive ML 联合创始人 Alessandro Cappelli 给出一个反直觉答案:问题不在模型、不在算力,而在你没用强化学习。
当大多数视觉模型公司在比拼参数和 Demo 时,Black Forest Labs 却在公开演讲中反复强调一句话:我们首先是一家研究公司。这场关于 Flux 的分享,真正的爆点不在产品更新,而在他们对视觉 AI 路线的“反直觉选择”。
大多数人还在教 AI 怎么多写点代码时,Michael Arnaldi 做了一件更狠的事:先给 AI 立规矩。这场关于 Vibe Engineering 的工作坊,核心不是更聪明的模型,而是如何用“Effect + 规则”让 AI Agent 不犯低级错、持续产出可维护代码。
当所有人都在为电价、土地和散热发愁时,Starcloud 的 CEO 直接给出一个反直觉答案:未来最便宜的算力在太空。更夸张的是,他们已经把 NVIDIA H100 送上轨道,还真的跑起了模型。
当所有人都在疯狂堆 GPU、比拼算力规模时,OpenAI 在最新一期播客里抛出一个反直觉结论:真正卡住 AI Scaling 的,不是芯片不够快,而是网络不够“聪明”。他们甚至为此重新发明了一种数据中心网络方式,并准备把它变成行业标准。
我们都在追更大的模型、更快的训练,却忽略了一个更“脏更累”的问题:模型在真实世界里到底怎么跑。Superlinked 的 Filip Makraduli 用一次亲身踩坑,揭开了小模型推理基础设施的巨大空白。
当大多数人还在讨论“哪个API更强”时,这场工作坊直接把话说透:你完全可以在本地,从零开始,亲手训练一个大语言模型。没有云算力神话,没有巨头资源,只有最朴素、也最容易被忽略的四个核心模块。
当所有人还在为更大的参数规模买单时,YC的一期Decoded却抛出一个刺耳的结论:真正让模型“会想”的,不是更大的模型,而是递归。两个2025年的研究表明,用极小参数、在推理时反复“思考”,就能碾压巨型LLM的推理任务表现。