一个月三次进化：Codex 正在把程序员变成“工程经理”

AI PM 编辑部 · 2025年09月08日 · 10 阅读 · AI/人工智能

多模态 AI应用云AI AI Agent AI安全提示工程代码生成代码理解对话AI ChatGPT

正在加载视频...

视频章节

OpenAI 最新一期 Build Hour 透露了一个反直觉信号：写代码，正在从“亲手敲”变成“指挥和审核”。Codex 不只是更强的 Copilot，而是一次对软件工程工作方式的重构。

一个月三次进化：Codex 正在把程序员变成“工程经理”

OpenAI 最新一期 Build Hour 透露了一个反直觉信号：写代码，正在从“亲手敲”变成“指挥和审核”。Codex 不只是更强的 Copilot，而是一次对软件工程工作方式的重构。

最炸的一点：Codex 不想帮你写代码，它想替你“管工程”

如果你还把 Codex 理解成“代码生成工具”，那你已经落后一个版本了。视频一开场，OpenAI 就给了一个很不一样的定位：Codex 是 software engineering agent，而不是 IDE 里的智能补全。

真正反直觉的地方在于，它并不强调“我能写多快”，而是强调“我能同时推进多少事”。在演示里，Dom 反复强调一个转变：开发者要从 individual contributor，切换到 engineering manager / architect 的心智模型。你不再盯着一个文件反复改，而是把任务拆好、扔出去，让 Codex 在后台异步跑，等你回来审核结果。

一句话总结这期 Build Hour 的底层逻辑：“人负责判断，Agent 负责执行；人同步思考，Agent 异步干活。”这不是效率优化，而是角色迁移。

一个 Codex，跑在所有地方：IDE、CLI、GitHub、云端

为什么 OpenAI 这次要花大量时间讲“心智模型”？因为 Codex 的形态在过去几个月里发生了质变。

最早的 Codex（今年 4 月）只是一个轻量级开源 CLI agent，后来又有 Web / Chat 体验。但问题也很明显：体验割裂、场景割裂，不符合真实开发流程。

上周的更新，才是关键转折点：
- 新的 Codex IDE Extension，支持 VS Code、Cursor 及其兼容分支
- CLI 能力真正“搬进”IDE
- 本地 + 云端任务打通
- Code review、云任务交接成为一等公民

于是 Codex 现在可以用两个维度来理解：
1）你在哪里用它：IDE、CLI、GitHub、Web、手机
2）它在哪里跑：本地机器，或安全的云端 sandbox

再加上统一的 ChatGPT 账号体系，OpenAI 试图解决一个长期困扰用户的问题：名字乱、产品散。现在只有一个 Codex，就像 GitHub——不同入口，同一个系统。

Demo 的真正价值：不是炫技，而是“工作流替换”

这期 Demo 看似信息量很大，但真正值得反复看的不是“它多聪明”，而是“它怎么被用”。

在本地 IDE 里，Codex 的 chat mode 被用来做 repo 级理解：单仓库、monorepo、复杂依赖，直接问。重点不在问答本身，而在于上下文是“真实代码库”，不是拷几段代码给模型。

切到 agent mode 后，变化更明显：Codex 不直接改代码，而是先提出 plan，再请求你 approve。这个交互设计本身就在强化一种工程化习惯：先对齐意图，再动手。

最颠覆的是 cloud tasks + best-of-N。Dom 直接并行起多个云任务，让 Codex 在不同容器里同时尝试多种实现，最后你只需要选一个 PR。这里的潜台词很重要：Prompt engineering 不再是瓶颈，算力 + 并行才是。

从“写到半夜”到“灵感先交给 Agent”

视频里有一个很生活化、但杀伤力极强的故事：Dom 半夜用手机，把一个 Rust + Python 的复杂想法丢给 Codex。第二天早上，一个可工作的 PR 已经在那里了。

这不是炫耀 Codex 多强，而是在暗示一个新习惯：灵感出现的那一刻，比你有没有 IDE 更重要。只要能记录任务，Agent 就能接手。

同样的逻辑也体现在多模态能力上：从一张 UI 图片生成 plan，再在云端执行大规模改动。人负责“看对不对”，Agent 负责“做完它”。

配合 agents.md、嵌套指令、测试和 lint，Codex 甚至可以验证自己的工作成果。这已经不是自动补全，而是自我约束的工程代理。

为什么这对 Cursor、Copilot 们是个压力测试

Q&A 环节里，Codex vs Cursor 被反复提起，本身就说明了问题的尖锐性。

Cursor 很强，但它的核心仍然是“IDE 内的增强型助手”；Codex 想占的，是“跨界面、跨时间、跨任务”的位置。它可以在 GitHub 上 review PR，在云端跑任务，在手机上接需求。

一旦开发者习惯把任务外包给 Agent，并在之后统一 review，那么 IDE 只是入口之一，而不是中心。这对整个开发工具生态来说，都是一次范式挑战。

总结

这期 Build Hour 传递的最重要信号不是 GPT‑5 有多强，而是 OpenAI 对“软件工程”的重新定义：未来的高手，不是写得最快的人，而是最会拆任务、设约束、做判断的人。

如果你是开发者，可以立刻做三件事：第一，用 Codex 或类似工具尝试并行任务，而不是一次只干一件；第二，开始写 agents.md，把隐性经验变成显性规则；第三，把 code review 当成主要价值输出。

最后留一个判断题：当 Agent 能 24 小时异步推进工程，人类工程师真正的护城河，会不会只剩下“品味”和“责任”？

关键词： Codex， AI Agent，软件工程， GPT-5， OpenAI

事实核查备注：需要核查：Build Hour 发布时间（2025-09-08）、GPT-5 发布时间是否为一个月前、Codex 首次发布于 4 月、IDE Extension 支持的具体编辑器范围、best-of-N 机制的官方表述

返回文章列表