你的 AI Agent 不只会写代码了,它已经能替你训练模型
如果你还以为“训练模型”是工程师的专属技能,那你已经落后了一代。Hugging Face 开源团队的 Merve Noyan 在这场演讲里抛出一个足够炸裂的事实:今天的 AI Agent,不只是用模型,而是能自己选模型、配显存、跑任务,甚至替你把模型训好。
如果你还以为“训练模型”是工程师的专属技能,那你已经落后了一代。Hugging Face 开源团队的 Merve Noyan 在这场演讲里抛出一个足够炸裂的事实:今天的 AI Agent,不只是用模型,而是能自己选模型、配显存、跑任务,甚至替你把模型训好。
曾经被嘲笑“又慢又没常识”的 Vision Transformer,如今却成了视觉领域的绝对主角。Roboflow 研究负责人 Isaac Robinson 用一场演讲给出答案:不是 ViT 变聪明了,而是预训练、算力和 LLM 基础设施把游戏规则彻底改写了。
我们都在追更大的模型、更快的训练,却忽略了一个更“脏更累”的问题:模型在真实世界里到底怎么跑。Superlinked 的 Filip Makraduli 用一次亲身踩坑,揭开了小模型推理基础设施的巨大空白。
当所有人都在讨论更大的模型、更贵的Token时,Google DeepMind在这场分享里反复强调了一件“反直觉”的事:真正能跑起来的AI,必须回到设备本身。从Gemma 4到端侧Agent,这不是性能妥协,而是一场架构转向。
如果你以为 Physical AI 只是“自动驾驶的另一个名字”,这期播客会直接打脸。Applied Intuition 把今天的物理世界,比作 Android 和 iOS 出现之前的手机市场——混乱、割裂、每家都在重复造轮子。而他们正在做的,是一个覆盖空、地、海的“自治操作系统”,而且几乎不允许出错。
把所有 API 一股脑喂给 Agent,看起来很聪明,实际上却是灾难。Cloudflare 的 Matt Carey 用一次真实的工程踩坑告诉你:上下文窗口不是瓶颈,思路才是。
如果你还沉迷于“跑最新、最大的模型”,那 AIE Miami 第二天的内容可能会让你坐立不安。从 agentic coding 的心态转变,到推理延迟的真实代价,再到 Cursor、AutoGPT 背后的产品哲学,这一天的共识只有一个:AI 工程正在彻底换玩法。
把 Gemma 4 直接跑在 iPhone 上,而且速度能到 40 tokens/s——这不是概念演示,而是已经能用的体验。Adrien Grondin 用 MLX 展示了边缘大模型的临界点:不靠云、不等网络,AI 开始真正住进你的手机。
最近一个名字在 AI 圈反复出现:Hermes Agent。它被称为“OpenClaw killer”,主打自我学习、内置记忆、可扩展技能,甚至能跑在 Android 手机上。这期视频第一次把它从“传说”拉到“可落地”,一步步告诉你它到底强在哪。
大多数人还在争论模型参数和推理能力时,Anthropic 的 David Soria Parra 已经把注意力转向了另一件事:连接。MCP 不只是一个协议,它正在成为 2026 年 AI Agent 能否真正落地的“隐形底座”。这场演讲,信息密度极高。