OpenAI Five对战OG前夜：一场45，000年训练换来的AI成人礼

AI PM 编辑部 · 2019年04月27日 · 2 阅读 · AI/人工智能

Greg Brockman 深度学习强化学习 Google DeepMind Microsoft Google OpenAI

正在加载视频...

视频章节

当Greg Brockman站在舞台上说出“我们不知道会发生什么”时，全场安静了。这不是一次AI稳赢的表演赛，而是人类第一次把一个靠强化学习“自学成才”的系统，推到世界冠军面前。输赢不重要，重要的是：AI第一次以一种近乎陌生智能的方式，公开面对人类最顶级玩家。

OpenAI Five对战OG前夜：一场45，000年训练换来的AI成人礼

当Greg Brockman站在舞台上说出“我们不知道会发生什么”时，全场安静了。这不是一次AI稳赢的表演赛，而是人类第一次把一个靠强化学习“自学成才”的系统，推到世界冠军面前。输赢不重要，重要的是：AI第一次以一种近乎陌生智能的方式，公开面对人类最顶级玩家。

不是表演赛，而是一次可能会失败的公开实验

在OpenAI Five对战OG之前，几乎所有人都默认：这是一次展示AI强大的“秀”。但Greg Brockman在开场就泼了一盆冷水——“我们真的不知道会发生什么。”

OG不是普通对手，而是当时的Dota 2世界冠军，实力远高于OpenAI Five此前私下对战过的任何职业队伍。这意味着什么？意味着OpenAI第一次选择在全世界观众面前，把一个可能会输、会出丑的AI系统推上舞台。

在AI研究史上，这是非常反常的一步。大多数系统只在‘我们已经很有把握’的条件下亮相，而这一次，OpenAI选择了承认不确定性。Brockman甚至直接说：如果今天有幸，这将是人类第一次现场看到AI与顶级职业选手的正面对抗。

这一选择本身，就已经比胜负更重要。它标志着AI研究开始从“可控演示”，走向“真实世界的不确定博弈”。

45，000年Dota训练，换来的不是套路，而是陌生感

OpenAI Five最容易被误解的一点，是“它是不是被人教会了怎么打Dota”。答案是否定的。

Brockman在演讲中反复强调：他们没有编码任何Dota战术，没有写‘如果对面来抓你就撤退’这样的规则。工程师只写了一件事——如何学习。

这个系统通过深度强化学习，从随机行动开始，不断从奖励与惩罚中调整策略。结果是，在短短十个月里，它累计“玩”了相当于45，000年的Dota时间。

但真正震撼的不是这个数字，而是随之而来的结果：OpenAI Five的打法，开始变得不像任何一个人类战队。

它会做出职业选手“感觉不对但又说不出错在哪”的决策；会在资源、站位、节奏上展现出一种冷静到近乎异类的风格。正如Brockman说的那样——“你今天看到的一切，都是电脑自己‘想’出来的。”

从AI的视角看，这场比赛甚至有点科幻：这是它第一次面对一种完全陌生、同样高度智能、但生理结构完全不同的‘外星智能’。

真正的野心：Dota只是外壳，学习能力才是核心

如果你以为OpenAI Five只是为了打游戏，那就低估了这个项目。

一个关键细节是：OpenAI的学习代码“并不知道自己在学Dota”。规则、画面、英雄技能，对它来说只是输入和反馈的一种形式。

这正是OpenAI想验证的东西——是否存在一种足够通用的学习机制，可以迁移到完全不同的问题上。

Brockman给出了几个已经发生的例子：同样的强化学习思路，已经被用来控制一只几乎无法通过传统编程完成任务的机器人手；未来，它可能会出现在养老护理机器人、创意辅助系统，甚至是我们今天还无法想象的新型交互系统中。

从这个角度看，Dota 2只是一个高复杂度、强对抗、信息不完全的“试验场”。如果一个系统能在这里学会协作、预判、牺牲与取舍，那么它在现实世界中的潜力，才刚刚开始。

一场告别赛，也是一次对AI边界的重新定义

这次OpenAI Five Finals，被明确称为该项目的“最终公开活动”。换句话说，这是一次告别。

但它并不是结束。Brockman明确表示：OpenAI未来仍然会继续Dota相关项目，只是形式和目标会发生变化。

值得注意的是，这个项目背后站着的不只是OpenAI，还有Valve、Google Cloud、Microsoft Azure等基础设施和合作伙伴。这不是一个实验室里的孤立尝试，而是一整套产业能力的合流。

在感谢OG战队时，Brockman说了一句意味深长的话：“无论AI让我们多么惊讶，我们对它们来说，可能会更加令人惊讶。”

这句话，或许才是这场比赛最核心的隐喻——当智能开始相互对视时，人类第一次意识到，自己不再是唯一的‘对手模板’。

总结

OpenAI Five对战OG，表面是一场电竞赛事，实质是一场关于学习能力边界的公开实验。它告诉AI从业者三件事：第一，真正有价值的系统，必须敢于面对不确定性；第二，通用学习能力比单点性能更重要；第三，当AI开始以“陌生智能”的方式行动时，我们需要重新思考如何评估、理解和共存。留给你的问题是：如果你的系统今天也要被推上这样的舞台，它真的准备好了吗？

关键词： OpenAI Five，强化学习，深度学习， Dota 2，通用人工智能

事实核查备注：需要核查的关键事实包括：Greg Brockman的职位表述（主席与CTO）、OpenAI Five累计训练时长“45，000年”的原始计算方式、OpenAI Five是否为该项目最后一次公开展示、提及的合作方（Valve、Google Cloud、Microsoft Azure）在项目中的具体角色、视频发布时间2019-04-27。

返回文章列表