OpenAI 现场演示 Codex:从零分到写游戏,程序员真正慌了

AI PM 编辑部 · 2021年08月10日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

这不是一次普通的产品发布,而是 OpenAI 当众展示:一个模型如何在一年内,从“代码准确率 0%”,进化到能写服务器、接 API、做小游戏。更反直觉的是,Ilya 亲口承认:这一切的原理,其实简单到令人不安。

OpenAI 现场演示 Codex:从零分到写游戏,程序员真正慌了

这不是一次普通的产品发布,而是 OpenAI 当众展示:一个模型如何在一年内,从“代码准确率 0%”,进化到能写服务器、接 API、做小游戏。更反直觉的是,Ilya 亲口承认:这一切的原理,其实简单到令人不安。

最反直觉的开场:GPT-3 根本不是为写代码设计的

演示一开始,Greg Brockman 就抛出一个几乎颠覆直觉的事实:GPT-3 从来没被设计成一个“写代码的模型”。它只是一个通用语言模型,却意外在编程任务上激发了开发者的想象力。更残酷的是,在 OpenAI 自己制定的代码基准测试中,GPT-3 的成绩是——0%。不是不够好,而是完全不行。

这反而成了 Codex 的起点。OpenAI 内部有整整四分之一的公司资源被投入进来,Ilya 和 Greg 断断续续讨论了“会写代码的模型”好几年。结果是:第一代 Codex 能解决 27% 的问题,而这次直播展示的版本,已经能解出 37%。别小看这 10 个百分点,在代码生成这种高精度任务里,这意味着“从玩具”到“可用工具”的质变。

Hello World 不重要,重要的是“你只要会说话”

真正让人后背发凉的,不是 Codex 能写 Hello World,而是它理解指令的方式。Greg 输入的不是代码,而是一段像注释一样的自然语言:"say hello world with empathy"。模型生成了 Python 代码,代码又生成了 HTML 页面,最后还被一个 Python Web Server 服务起来。

这里的关键不是“多语言”,而是“无缝切换”。Codex 在 Python、HTML、服务器逻辑之间来回跳转,没有显式提示。这意味着什么?意味着你不再需要记住“我是不是该 import http.server”,而只需要知道你想要一个网页。Greg 自嘲说,这段起 Web Server 的代码他写过二十多次,但依然记不住——而 Codex 记住了。

这不是自动补全,这是把‘怎么做’整个外包给模型。

Ilya 的那句话,揭开了真正让人不安的地方

直播中最值得反复回看的,是 Ilya Sutskever 那段几乎轻描淡写的解释:"我们所做的一切,本质上只是把代码自动补全做到极致。"

没有规则引擎,没有手写专家系统。就是一个足够大的神经网络,用数学上可解释的训练方法,在海量代码上学会“下一个 token 应该是什么”。但一旦这个能力跨过某个阈值,它就开始表现出:理解 API 文档、按人类描述调用 Mailchimp、甚至在看不到屏幕的情况下,根据文字推理出“按左键人应该往左走”。

这就是 Codex 最恐怖的地方:能力不是被设计出来的,而是‘涌现’出来的。

从接 API 到写游戏:软件正在变成“可对话的”

后半段演示几乎是在不断提高赌注:先是教 Codex 使用一个它“理论上不知道”的 Mailchimp API,只需把人类可读的文档贴给它;再往后,直接开始写一个躲避巨石的小游戏。

注意一个细节:模型并不知道画面长什么样,它只能看到代码文本。但当 Greg 说“把人物放在屏幕底部,用方向键控制”,Codex 能推理出坐标、事件监听、移动逻辑。这个过程已经不是模板匹配,而是任务级理解。

Ilya 在最后点破主题:今天世界上的一切软件,几乎都有 API。而一旦模型能替你‘读文档 + 调 API’,软件就不再是你操作的对象,而是你对话的对象。

总结

这场 Codex 演示,真正的价值不在于“AI 会不会取代程序员”,而在于一个更现实的判断:写代码的门槛正在被重新定义。未来的核心能力,不是记住语法和框架,而是把需求说清楚、把系统拆清楚、把意图表达清楚。

如果你是工程师,现在就该练习如何用自然语言精确描述问题;如果你是产品或创业者,这意味着原型和自动化的成本会继续塌缩。最后留一个判断题:当“会用 API”变成模型的默认技能,人类开发者,真正不可替代的那一层,会在哪里?


关键词: OpenAI, Codex, 代码生成, 大语言模型, AI 编程

事实核查备注: 需要核查:Codex 基准测试从 0% 到 27% 再到 37% 的具体指标定义;视频发布时间 2021-08-10;出镜人物为 Greg Brockman 与 Ilya Sutskever;Codex API 当日开放 beta 与编程竞赛时间(周四 10am Pacific)。