OpenAI 把终端变成AI同事：Codex CLI现场改游戏并上线

AI PM 编辑部 · 2025年10月14日 · 7 阅读 · AI/人工智能

AI推理 AI搜索 AI Agent AI工具代码生成 ChatGPT

正在加载视频...

视频章节

这不是写代码的演示，而是一场“AI坐在你旁边干活”的现场。OpenAI 用 Codex CLI 展示了 GPT‑5‑Codex 如何在终端里规划、改代码、查文档、部署应用，最后还真的把一个单机小游戏改成了实时联机。

OpenAI 把终端变成AI同事：Codex CLI现场改游戏并上线

这不是写代码的演示，而是一场“AI坐在你旁边干活”的现场。OpenAI 用 Codex CLI 展示了 GPT‑5‑Codex 如何在终端里规划、改代码、查文档、部署应用，最后还真的把一个单机小游戏改成了实时联机。

最反直觉的一幕：不是写代码，而是先“想清楚怎么干”

视频一开始就戳破了很多人对 AI 编程的误解。他们没有让 Codex 直接改代码，而是先丢给它一句话：“给这个小游戏做一个多人模式的计划。”接下来发生的事情很关键：Codex 不是胡写，而是在终端里一步步拆解任务、列步骤、判断风险。

这背后用的是 GPT‑5‑Codex——OpenAI 专门为“复杂编码任务”优化的模型。Roma 和 Eson 特别强调了一点：很多人低估了 Codex 的价值，不在于敲代码有多快，而在于它能像一个资深工程师一样，先把事情想明白。更有意思的是，这个小游戏本身，最初就是“GPT‑5 一条 prompt 完整生成的”，现在等于是在 AI 写的代码上，再让 AI 继续演进它。

终端里的“透明思考”：你可以偷看它在想什么

一个容易被忽略但极其重要的功能，是 Codex CLI 的 transcript 模式。通过快捷键，开发者可以看到模型当前在做什么、改了哪些文件、甚至是推理过程的展开版本。

这解决了 AI 编程最大的信任问题：你不是把项目“黑盒交出去”。如果你不想看细节，也可以让 Codex 用“高层摘要”模式，只告诉你：我现在在做哪一步、下一步是什么。

这在实际工作里意义很大。它既能当一个认真干活的 Agent，也能当一个随时被你打断、审查、纠偏的助手，而不是失控的自动化脚本。

模型切换 + 权限沙箱，才是 Codex 真正专业的地方

Eson 在演示中提到两个“老工程师一眼就懂”的设计。

第一是模型切换。简单任务，用推理级别低、速度快的模型；复杂改造，可以让 Codex 连续工作数小时。这意味着你不再需要“一个模型打天下”，而是把模型当算力资源来调度。

第二是 approvals（权限控制）。Codex 有 read-only、auto、full 三种模式。默认 auto 只能在当前项目目录里读写，不会乱动你电脑上的其他东西。需要部署、调用 CLI 工具时，才手动切到 full。

这不是炫技，而是工程安全感。它明确告诉你：AI 是在你的边界之内工作，而不是一个随时可能闯祸的脚本。

真正让人起鸡皮疙瘩的：查文档、部署、上线，全在一个 CLI 里

高潮出现在后半段。他们让 Codex：查最新的 Vercel 文档、使用 Vercel CLI 部署应用、然后直接把链接发给另一台电脑试玩。

整个过程没有切浏览器、没有复制粘贴教程，全靠 Codex 的 web search + 执行动作完成。最后，两台电脑同时控制同一个小游戏，实时同步。

Roma 说了一句很容易被忽略的话：Codex 不只是写代码，它还能用来排查线上 bug、看日志、整合分散的数据源。这意味着，它正在逼近一个真正的“通用工程 Agent”，而不只是 IDE 插件。

总结

这条视频真正传达的信息不是“AI 又更强了”，而是工作方式正在变。Codex CLI 展示的是一种新范式：你在终端里，不是敲命令，而是在指挥一个懂上下文、懂边界、能长期执行的 AI 同事。

如果你是工程师，现在就该思考三件事：哪些任务适合交给 Agent 连续跑？哪些环节必须保留人工审批？你是否需要开始用“计划能力”而不是“补全能力”来评估模型？可以预见的是，未来拉开差距的，不是谁会不会用 AI，而是谁更早把 AI 纳入自己的工程工作流。

关键词： Codex CLI， GPT-5-Codex， AI Agent，终端工具，代码生成

事实核查备注：需要核查：GPT-5 与 GPT-5-Codex 的正式命名；Codex CLI 的发布时间；Vercel 部署是否为现场真实完成；视频发布时间为 2025-10-14

返回文章列表