xAI 内部自曝:3个月造出 Grok Imagine,视频智能真正的引擎竟是语言模型
如果你还以为视频模型的突破来自更强的视觉网络,这期访谈会直接颠覆你。xAI 团队罕见披露:视频智能的核心进展,其实主要来自大语言模型本身。从 Grok Imagine 的极速落地,到 VideoGen 与 World Model 的分野,这是一场只有一线从业者才会说出口的内部复盘。
如果你还以为视频模型的突破来自更强的视觉网络,这期访谈会直接颠覆你。xAI 团队罕见披露:视频智能的核心进展,其实主要来自大语言模型本身。从 Grok Imagine 的极速落地,到 VideoGen 与 World Model 的分野,这是一场只有一线从业者才会说出口的内部复盘。
大多数人以为代码补全的未来在更大的模型,但 Zed 团队走了相反的路:用一个小模型,盯住“你下一次会怎么改代码”。更反直觉的是,它的训练数据不是标注出来的,而是你每天真实的编辑行为。Ben Kunkle 用一次演讲,拆开了这个几乎没人公开讲过的生产级训练流程。
一位 Sentry 高级工程师公开承认:从 2025 年 12 月开始,她几乎不再亲手写代码。更反直觉的是,她的效率和影响力反而大幅提升。她用一组真实数据,颠覆了整个 AI 编程圈最流行的幻想。
当所有人都在担心“AI 会不会抢走我的工作”时,这支团队做了一个反直觉的实验:把能自动化的全部交给 AI。结果不是裁员,而是工作更多、人也更多。这期视频讲清了一件很多人没想明白的事:自动化的终点,可能恰恰是人类价值的放大器。
如果你还在拖拽文本框、对齐图片、调动画,这条视频会让你非常不舒服。Peter Yang 公开展示:用 Claude Code + HTML,他12分钟生成一整套可交互、带动画、还能自动质检的幻灯片。这不是效率提升,而是工作方式的断代更新。
多数人还在拼模型参数时,最好的 AI Agent 已经换了赛道。Mardu Swanepoel 提出一个反直觉观点:决定 Agent 上限的,不是能力,而是设计模式。这场分享拆解了四个正在被 Cursor、Claude 等产品验证的关键机制。
几乎所有人都在谈“AI Agent 会不会取代人类”,但这期《AI Daily Brief》给了一个更反直觉的答案:Agent 越强,人反而越值钱。2026 年被称为“Agent 成为现实的一年”,但真正的变化不在技术本身,而在我们如何工作、如何分工,以及为什么人类判断正在变成稀缺资源。
如果你以为 AI Agent 的核心难题是“模型还不够聪明”,那 Google DeepMind 会当场反驳你。在这场内部工程师的公开分享中,他们反复强调:真正把 Agent 跑到 Google 规模,最大的瓶颈是 Token、成本、配额,以及一整套几乎没人聊过的“代理操作系统”。
当所有人都在卷向量数据库、Agent 框架和微调时,Google DeepMind 的 Paige 却在台上泼了一盆冷水:这些东西,迟早都会被模型本身吞噬。这场长达一小时的分享,不是产品发布,而是一份来自一线的行业预言。
很多人以为“真·AI 应用”只能在云端完成,但 Google DeepMind 在这场 AMA 里给了一个完全相反的答案:Android 正在把生成式 AI 直接塞进手机里,而且已经能用。这场对话不讲概念,直面限制、取舍和真正可落地的路径。