正在加载视频...
视频章节
如果你还以为 Codex 是“过气项目”,那你可能已经错过了一个关键转折点。Every 团队在这支近一小时的视频里,毫不掩饰地讲清楚了一件事:他们为什么从 Claude Code 切换到 Codex,以及 Codex 是如何在短短几个月内,从“垃圾”变成日常离不开的生产力核心。
三个月前还被嫌弃,如今全员转投:Every 为什么放弃 Claude Code 改用 Codex
如果你还以为 Codex 是“过气项目”,那你可能已经错过了一个关键转折点。Every 团队在这支近一小时的视频里,毫不掩饰地讲清楚了一件事:他们为什么从 Claude Code 切换到 Codex,以及 Codex 是如何在短短几个月内,从“垃圾”变成日常离不开的生产力核心。
最反直觉的开场:三个月前还是“垃圾”的 Codex
视频一开始就抛出了一个极具挑衅性的判断:如果把时间拨回三个月、甚至六个月前,Codex 在他们眼里“几乎没法用”。这不是客气的技术吐槽,而是一个已经在真实团队里被淘汰过的工具。
正因为如此,后面的转折才显得格外重要。Every 团队并不是那种“追新工具上瘾”的人,相反,他们已经在 Claude Code 上形成了稳定工作流。但 Codex 的变化速度,快到让他们不得不重新评估——不是“要不要试试”,而是“继续不用会不会错过什么”。
这个判断本身就释放了一个信号:AI 编程工具的竞争,已经不是线性进化,而是阶段性跃迁。你上一次用它的体验,很可能已经完全过期。
他们看到的不是模型,而是“新的工作系统”
在视频中反复出现的一个关键词,并不是“更聪明”,而是“像一个新的操作系统”。Codex 吸引他们的点,不只是回答质量,而是它开始承担一种更高层级的角色:你不再只是向它提问,而是在它之上组织工作。
他们讨论的重点,已经从“这段代码写得对不对”,转向“我该如何把任务交给它”。这背后隐含的变化是:Codex 更像一个持续在线的协作者,而不是一次性工具。
这种感觉,正是他们决定切换的重要原因之一。Claude Code 在单次交互上依然强,但 Codex 展现出的,是一种更系统化的使用方式——能承载更长的上下文、更复杂的任务流,以及更接近真实开发节奏的协作体验。
真实演示,比参数对比更有说服力
视频中段,他们直接打开 Codex 应用进行演示。这里没有宏大的技术宣言,反而是一些很“日常”的反应,比如那句脱口而出的“This is so sick”。
为什么这种反应重要?因为它通常只会出现在两种情况下:要么是炫技型 Demo,要么是真的戳中了痛点。结合上下文,显然是后者。
他们展示的并不是极端复杂的代码挑战,而是日常开发里最消耗心力的部分:来回修改、上下文切换、理解已有代码结构。Codex 在这些地方表现出的顺滑感,让整个团队产生了一种共识:这不是单点能力提升,而是整体体验的跃迁。
从“工具评测”到“团队决策”的关键一步
一个细节值得注意:这次切换并不是某个工程师的个人偏好,而是团队层面的共识讨论。视频里多次出现“我也有同样感觉”“我完全同意”这样的反馈。
这说明 Codex 的优势,并不是只有重度用户才能感知,而是对不同角色都成立。这一点,对真正的生产环境至关重要。
当一个 AI 工具开始影响协作方式,而不仅仅是个人效率时,它就已经跨过了‘玩具’阶段。Every 的态度很明确:他们不是在押注某个模型的未来,而是在选择一个更符合未来工作方式的平台。
OpenAI 这次做对了什么?
视频后半段明确提到:OpenAI 在 Codex 上的推进方式,和以往给人的印象不太一样。不是一味追求发布噱头,而是快速迭代、直接面向真实使用场景。
他们甚至提到,Codex 的变化让人有种“终于对齐了”的感觉——对齐开发者真正的需求,而不是 benchmark。
这也解释了为什么 Codex 能在短时间内逆转口碑:不是因为某一个惊艳功能,而是一连串体验层面的改进叠加,最终跨过了可用性的临界点。
总结
Every 的这次切换,本质上给所有 AI 从业者提了个醒:别用过去的体验,判断今天的工具。尤其是在 AI 编程这个赛道,三个月就是一个时代。
如果你还停留在“哪个模型更聪明”的比较里,可能已经落后于真正的竞争焦点——谁能成为你的工作系统。对个人来说,最实际的行动建议只有一个:重新试用那些你曾经放弃过的工具,用真实任务,而不是旧印象,来做判断。下一次效率跃迁,很可能就藏在你以为‘不行了’的产品里。
关键词: Codex, Claude Code, AI 编程, OpenAI, 开发者工具
事实核查备注: 需要核查:1)Every 团队是否明确表示在三到六个月前认为 Codex 不可用;2)视频中是否明确将 Codex 描述为“新的操作系统”级别体验;3)OpenAI 是否在视频中被直接点名为 Codex 背后的公司支持方;4)演示环节的具体功能是否被准确概括而未夸大。