xAI 内部自曝:3个月造出 Grok Imagine,视频智能真正的引擎竟是语言模型
如果你还以为视频模型的突破来自更强的视觉网络,这期访谈会直接颠覆你。xAI 团队罕见披露:视频智能的核心进展,其实主要来自大语言模型本身。从 Grok Imagine 的极速落地,到 VideoGen 与 World Model 的分野,这是一场只有一线从业者才会说出口的内部复盘。
如果你还以为视频模型的突破来自更强的视觉网络,这期访谈会直接颠覆你。xAI 团队罕见披露:视频智能的核心进展,其实主要来自大语言模型本身。从 Grok Imagine 的极速落地,到 VideoGen 与 World Model 的分野,这是一场只有一线从业者才会说出口的内部复盘。
卖掉上一家公司后,Josh Pigford没有组团队、没有写长规划,而是一个人并行做5款AI产品。他最反直觉的做法是:用大模型互相“挑刺”,最快24小时上线。更狠的是,他认为“做太久才发布”本身就是创业的大坑。
很多人以为AI的价值在“更聪明”,但这支顶级赛车队证明:真正的胜负,藏在7秒的进站和0.1秒的决策里。OpenAI把模型从实验室推上赛道,第一次让AI直面时间、压力和不可逆的真实世界。
一位 Sentry 高级工程师公开承认:从 2025 年 12 月开始,她几乎不再亲手写代码。更反直觉的是,她的效率和影响力反而大幅提升。她用一组真实数据,颠覆了整个 AI 编程圈最流行的幻想。
当生成式AI把世界推向指数狂欢,Apollo CEO Marc Rowan却在a16z的对话中抛出一个刺耳的判断:真正失灵的不是技术,而是资本配置。10只股票占据近半个标普,几乎所有人却对最重要的AI公司“零敞口”。这场对话,讲清了AI时代最容易被忽视的结构性风险。
如果你还在拖拽文本框、对齐图片、调动画,这条视频会让你非常不舒服。Peter Yang 公开展示:用 Claude Code + HTML,他12分钟生成一整套可交互、带动画、还能自动质检的幻灯片。这不是效率提升,而是工作方式的断代更新。
如果你还默认“GenAI 和 AI Agent 天然属于数据科学家”,这支视频会让你停下来重新想一遍。Braintrust 的 Phil Hetzel 用大量一线观察,拆穿了一个行业惯性认知:真正决定 Agent 成败的,可能根本不是模型能力,而是离问题有多近。
当所有人都在卷向量数据库、Agent 框架和微调时,Google DeepMind 的 Paige 却在台上泼了一盆冷水:这些东西,迟早都会被模型本身吞噬。这场长达一小时的分享,不是产品发布,而是一份来自一线的行业预言。
很多人以为“真·AI 应用”只能在云端完成,但 Google DeepMind 在这场 AMA 里给了一个完全相反的答案:Android 正在把生成式 AI 直接塞进手机里,而且已经能用。这场对话不讲概念,直面限制、取舍和真正可落地的路径。
Cerebras 曾经做出“世界上最快的 AI 计算机”,却多年无人问津。直到生成式 AI 爆发,它突然成为 OpenAI、AWS 争抢的对象,并走向 63 亿美元估值的 IPO。Andrew Feldman 亲口讲述:为什么速度会重塑商业模式,为什么真正的壁垒要熬 10 年。