OpenAI 把终端变成AI同事:Codex CLI现场改游戏并上线

AI PM 编辑部 · 2025年10月14日 · 7 阅读 · AI/人工智能

正在加载视频...

视频章节

这不是写代码的演示,而是一场“AI坐在你旁边干活”的现场。OpenAI 用 Codex CLI 展示了 GPT‑5‑Codex 如何在终端里规划、改代码、查文档、部署应用,最后还真的把一个单机小游戏改成了实时联机。

OpenAI 把终端变成AI同事:Codex CLI现场改游戏并上线

这不是写代码的演示,而是一场“AI坐在你旁边干活”的现场。OpenAI 用 Codex CLI 展示了 GPT‑5‑Codex 如何在终端里规划、改代码、查文档、部署应用,最后还真的把一个单机小游戏改成了实时联机。

最反直觉的一幕:不是写代码,而是先“想清楚怎么干”

视频一开始就戳破了很多人对 AI 编程的误解。他们没有让 Codex 直接改代码,而是先丢给它一句话:“给这个小游戏做一个多人模式的计划。”接下来发生的事情很关键:Codex 不是胡写,而是在终端里一步步拆解任务、列步骤、判断风险。

这背后用的是 GPT‑5‑Codex——OpenAI 专门为“复杂编码任务”优化的模型。Roma 和 Eson 特别强调了一点:很多人低估了 Codex 的价值,不在于敲代码有多快,而在于它能像一个资深工程师一样,先把事情想明白。更有意思的是,这个小游戏本身,最初就是“GPT‑5 一条 prompt 完整生成的”,现在等于是在 AI 写的代码上,再让 AI 继续演进它。

终端里的“透明思考”:你可以偷看它在想什么

一个容易被忽略但极其重要的功能,是 Codex CLI 的 transcript 模式。通过快捷键,开发者可以看到模型当前在做什么、改了哪些文件、甚至是推理过程的展开版本。

这解决了 AI 编程最大的信任问题:你不是把项目“黑盒交出去”。如果你不想看细节,也可以让 Codex 用“高层摘要”模式,只告诉你:我现在在做哪一步、下一步是什么。

这在实际工作里意义很大。它既能当一个认真干活的 Agent,也能当一个随时被你打断、审查、纠偏的助手,而不是失控的自动化脚本。

模型切换 + 权限沙箱,才是 Codex 真正专业的地方

Eson 在演示中提到两个“老工程师一眼就懂”的设计。

第一是模型切换。简单任务,用推理级别低、速度快的模型;复杂改造,可以让 Codex 连续工作数小时。这意味着你不再需要“一个模型打天下”,而是把模型当算力资源来调度。

第二是 approvals(权限控制)。Codex 有 read-only、auto、full 三种模式。默认 auto 只能在当前项目目录里读写,不会乱动你电脑上的其他东西。需要部署、调用 CLI 工具时,才手动切到 full。

这不是炫技,而是工程安全感。它明确告诉你:AI 是在你的边界之内工作,而不是一个随时可能闯祸的脚本。

真正让人起鸡皮疙瘩的:查文档、部署、上线,全在一个 CLI 里

高潮出现在后半段。他们让 Codex:查最新的 Vercel 文档、使用 Vercel CLI 部署应用、然后直接把链接发给另一台电脑试玩。

整个过程没有切浏览器、没有复制粘贴教程,全靠 Codex 的 web search + 执行动作完成。最后,两台电脑同时控制同一个小游戏,实时同步。

Roma 说了一句很容易被忽略的话:Codex 不只是写代码,它还能用来排查线上 bug、看日志、整合分散的数据源。这意味着,它正在逼近一个真正的“通用工程 Agent”,而不只是 IDE 插件。

总结

这条视频真正传达的信息不是“AI 又更强了”,而是工作方式正在变。Codex CLI 展示的是一种新范式:你在终端里,不是敲命令,而是在指挥一个懂上下文、懂边界、能长期执行的 AI 同事。

如果你是工程师,现在就该思考三件事:哪些任务适合交给 Agent 连续跑?哪些环节必须保留人工审批?你是否需要开始用“计划能力”而不是“补全能力”来评估模型?可以预见的是,未来拉开差距的,不是谁会不会用 AI,而是谁更早把 AI 纳入自己的工程工作流。


关键词: Codex CLI, GPT-5-Codex, AI Agent, 终端工具, 代码生成

事实核查备注: 需要核查:GPT-5 与 GPT-5-Codex 的正式命名;Codex CLI 的发布时间;Vercel 部署是否为现场真实完成;视频发布时间为 2025-10-14