把AI Agent真正“发货”:一次用Dagger构建工程级智能体的实战
这不是一场关于“AI 很强”的演示,而是一场关于如何把 AI Agent 安全、可复现、可维护地交付到真实工程里的工作坊。Kyle Penfound 和 Jeremy Adams 用 Dagger 从零搭起一个能跑在本地、CI 和 GitHub Actions 里的 Agent,展示了工程化智能体的完整路径。
这不是一场关于“AI 很强”的演示,而是一场关于如何把 AI Agent 安全、可复现、可维护地交付到真实工程里的工作坊。Kyle Penfound 和 Jeremy Adams 用 Dagger 从零搭起一个能跑在本地、CI 和 GitHub Actions 里的 Agent,展示了工程化智能体的完整路径。
这场由 Bench 的 Damien Murphy 带来的 Workshop,用真实代码和现场 Demo 讲清了两个当下最火的概念:A2A 与 MCP。它不仅回答了“该用哪个”,更重要的是解释了“什么时候千万别用”,以及如何把它们组合成可落地的自动化系统。
Google Labs 的产品经理 Rustin Banks 在这场演讲中,讲述了异步编码代理 Jules 的诞生背景、真实使用案例,以及它如何迫使开发者从“串行思维”转向“并行思维”。这不仅是一个新工具的发布,更是一种全新开发范式的预演。
这场来自Intuit高级工程师的分享,罕见地揭示了生成式AI在强监管行业中的真实落地方式:不是炫技,而是围绕安全、评估和用户理解构建系统能力。文章将还原TurboTax背后的LLM架构、关键技术取舍,以及他们踩过的坑。
Retool 产品负责人 Donald Hruska 直言:企业在 AI 上已经投入了半万亿美元,却大多停留在聊天机器人和代码补全阶段。真正的拐点,是“能接入生产系统、带护栏的 AI Agents”。这场演讲系统讲清了 agents 为什么今年才成立、难点在哪,以及企业该如何在“自建还是买平台”之间做出理性选择。
Adobe应用AI负责人Muktesh Mishra在这场分享中,系统拆解了为何“评估(Evals)”已成为AI应用的生命线,以及如何跳出准确率与相似度的局限,把Evals当作一套可规模化、可演进的工程体系来建设。
当 Sam Altman 说“这是 idea guy 的时代”时,很多人以为只是口号。但在这期播客里,Google AI 的核心负责人 Josh Woodward 用一连串未发布或刚上线的工具,展示了另一种可能:不是更聪明的模型,而是更懂怎么把人变高效的 AI。
这期视频中,The AI Daily Brief 主播用一个非常具体、也极具现实意义的任务测试了刚发布不久的 ChatGPT Agent:让它从零创建一门“AI Agent 管理”完整课程。结果既不完美,也极具启发性,清楚展示了通用智能体正在逼近的能力边界。
如果你以为创业一定要融资、写代码、做平台,这期视频会直接把你打醒。连续卖掉三家风投公司后,Greg Isenberg给出了5个“几乎不要钱”的创业点子:不性感、不高科技,但每一个都精准踩在AI时代的真实需求上,甚至有人能靠它们做到月入10万美元。
一项引发争议的研究称:使用 AI 编程工具的开发者,速度反而慢了 19%。但视频作者指出,问题不在 AI,而在学习曲线、工作流错配和媒体误读。真正的结论,远比“AI 降效”复杂得多。