每一次敲键盘都在训练模型:Zed 2如何用真实编辑数据击败大模型
大多数人以为代码补全的未来在更大的模型,但 Zed 团队走了相反的路:用一个小模型,盯住“你下一次会怎么改代码”。更反直觉的是,它的训练数据不是标注出来的,而是你每天真实的编辑行为。Ben Kunkle 用一次演讲,拆开了这个几乎没人公开讲过的生产级训练流程。
大多数人以为代码补全的未来在更大的模型,但 Zed 团队走了相反的路:用一个小模型,盯住“你下一次会怎么改代码”。更反直觉的是,它的训练数据不是标注出来的,而是你每天真实的编辑行为。Ben Kunkle 用一次演讲,拆开了这个几乎没人公开讲过的生产级训练流程。
AI圈又开始喊“放缓了”。模型进步没那么炸裂、安装量开始走平、编码工具降温——熟悉的恐慌配方。但这期《AI Daily Brief》抛出的关键信息是:这可能不是衰退,而是一次更健康、更真实的分化时刻。
很多 AI Agent 看起来很聪明,却在真正要做决定时频频翻车。Neo4j 在这场分享里抛出一个反直觉观点:问题不在模型,而在“上下文”。Context Graph 不是给 AI 更多知识,而是第一次系统性地告诉它——为什么要这么做。
当所有人都在把最强的大模型推向云端,Alex Cheema 却在做一件反方向的事:让 Frontier AI 跑在你自己的硬件上。这场看似“逆潮流”的尝试,背后藏着对成本、控制权和 AI 未来形态的深刻判断。
当所有人都在追逐更大的参数规模时,SPC 的这场对话却把焦点拉回到一个反直觉的方向:把模型做小、把推理做快,可能才是 AI 真正的“北极星”。这里不仅有技术判断,还有行业竞争的真实气味。
当所有人还在讨论“更大的模型、更贵的GPU”时,一位工程师直接给出结论:这是条正在失效的路。在这场演讲中,Adrian Bertagnoli 用真实系统和硬数据证明——不靠更强模型,靠“异构智能”,AI可以同时变得更聪明、更快、还便宜一个数量级。
这次 Google I/O,DeepMind 高管透露了一个被很多人忽略的信号:模型不再是主角,真正的主线是“智能体如何长期在线、持续干活”。从 Gemini 3.5 Flash 到 Omni,再到托管 Agent,Google 正在重写开发者与 AI 的关系。
当代码生成从每秒50个Token飙到1200个,真正的瓶颈不再是模型,而是人。Cerebras的Sarah Chieng在这场演讲中抛出一个反直觉观点:模型越快,开发者越要“慢”。否则,我们只是在用20倍的速度制造技术债。
很多人以为“真·AI 应用”只能在云端完成,但 Google DeepMind 在这场 AMA 里给了一个完全相反的答案:Android 正在把生成式 AI 直接塞进手机里,而且已经能用。这场对话不讲概念,直面限制、取舍和真正可落地的路径。
Cerebras 曾经做出“世界上最快的 AI 计算机”,却多年无人问津。直到生成式 AI 爆发,它突然成为 OpenAI、AWS 争抢的对象,并走向 63 亿美元估值的 IPO。Andrew Feldman 亲口讲述:为什么速度会重塑商业模式,为什么真正的壁垒要熬 10 年。