OpenAI Five击败OG的第一局，真正震撼的不是胜负而是思路

AI PM 编辑部 · 2019年04月27日 · 0 阅读 · AI/人工智能

正在加载视频...

视频章节

2019年，OpenAI Five在Dota 2总决赛中拿下OG的第一局。很多人只记住了“AI赢了职业冠军”，但真正值得反复观看的，是这局比赛里暴露出的AI决策方式：冷静、残酷，而且几乎不受人类直觉影响。这不是一场表演赛，而是一堂给所有AI从业者上的公开课。

OpenAI Five击败OG的第一局，真正震撼的不是胜负而是思路

2019年，OpenAI Five在Dota 2总决赛中拿下OG的第一局。很多人只记住了“AI赢了职业冠军”，但真正值得反复观看的，是这局比赛里暴露出的AI决策方式：冷静、残酷，而且几乎不受人类直觉影响。这不是一场表演赛，而是一堂给所有AI从业者上的公开课。

当世界冠军登场，AI却完全不“敬畏”

比赛开场，镜头给到的是TI8冠军OG，全场欢呼，这是人类电竞的巅峰之一。但OpenAI Five的“态度”从一开始就很反直觉——它并不在乎你是谁。解说在片段中直言：“我可以直接告诉你他们的策略，因为这不重要。”这句话放在人类战队身上几乎是侮辱，但对AI来说却是事实。OpenAI Five不是根据对手名气、历史战绩来调整心态，它只根据当前状态空间和胜率估计做决策。对AI系统而言，OG不是传奇，只是一组变量。

95%胜率判断：AI如何比人类更早看到结局

在比赛中段，解说给出了一个让人类选手背脊发凉的数字：“这是95%的胜率，站在OpenAI的角度。”对人类来说，这个时间点远没到投降的时候，地图上还有资源、还有翻盘可能。但OpenAI Five已经“看完了结局”。这背后不是运气，而是长期自博弈训练形成的模式识别能力。AI并不是在算一条最优路径，而是在评估：从所有可能未来中，有多少已经不可逆。于是你会看到一个很诡异的现象——AI开始做一些在人类看来过于稳健、甚至有点无聊的决策，但这些决策叠加在一起，几乎不给对手任何回旋空间。

协调性不是操作，而是共识的产物

片段后半段有一句评价非常关键：“这就是为什么他们总是这么协调。”OpenAI Five并不存在人类意义上的指挥、沟通或情绪管理，它的协调来自于统一的目标函数。每个英雄并不是在‘配合队友’，而是在独立最大化同一个胜率指标。这带来的结果是：几乎没有犹豫、没有信息延迟、没有‘你以为我会来’。当他们选择推进、击杀、逼迫高地甚至最终拿下超级兵（mega creeps）时，看起来像是完美执行的战术，其实只是系统在不同节点做出了高度一致的判断。

从‘这能行吗’到‘他们已经赢了’

解说在比赛中多次发出疑问：‘这真的能行吗？’这恰恰代表了人类直觉的失效。OpenAI Five经常选择那些不符合当下版本主流理解的节奏，但结果却一次次证明有效。直到比赛末段，OG尝试最后一波防守，解说语气已经发生变化：‘他们可能有最后一次防守……OpenAI拿下第一局。’这一刻的落差，是这场比赛最残酷也最精彩的地方——不是AI秀操作，而是人类逐渐意识到，自己面对的是一种完全不同的对手。

总结

如果你是AI从业者，这场比赛真正的价值不在Dota 2，而在方法论。OpenAI Five展示的不是某个模型有多强，而是：当目标足够清晰、反馈足够密集、训练规模足够大时，系统会发展出超出人类直觉的策略能力。它提醒我们，未来很多领域的AI优势，可能并不体现在‘更聪明’，而是‘更不在乎我们习以为常的判断方式’。一个值得思考的问题是：在你的工作场景里，有没有哪些‘人类觉得还没结束’的时刻，其实已经可以交给模型提前做出决定？

关键词： OpenAI Five， Dota 2， OG战队，自博弈， AI决策

事实核查备注：需要核查：比赛发布时间是否为2019-04-27；OpenAI Five对阵OG是否为总决赛第一局；解说中提到的95%胜率表述是否为原话；OG为TI8冠军这一背景描述。

返回文章列表