Noam Brown谈通用智能：从博弈AI到与人类协作

AI PM 编辑部 · 2023年04月25日 · 2 阅读 · AI/人工智能

通用人工智能

正在加载视频...

视频章节

Meta研究科学家Noam Brown在《No Priors》首期节目中，回顾了自己从博弈AI研究到通用人工智能探索的关键转折。他以真实项目经验为线索，讨论了高风险研究、评估AGI的方法，以及AI与人类协作的长期意义。

Noam Brown谈通用智能：从博弈AI到与人类协作

Meta研究科学家Noam Brown在《No Priors》首期节目中，回顾了自己从博弈AI研究到通用人工智能探索的关键转折。他以真实项目经验为线索，讨论了高风险研究、评估AGI的方法，以及AI与人类协作的长期意义。

从好奇心出发：走上高风险研究之路

理解Noam Brown的研究路径很重要，因为它解释了他为何始终选择“难而不稳”的问题。节目一开始，他回顾了自己如何被复杂系统和博弈问题吸引，并逐步走向人工智能研究。在他看来，真正重要的突破往往来自那些看起来不太“安全”的方向。

他在访谈中直言，“all research is high risk reward”，意思是所有真正有价值的研究，本质上都伴随着失败概率。这并不是一句空泛的鸡汤，而是他亲身经历的总结：在博弈AI领域，很多想法多年都看不到成果，但一旦成功，就会改变人们对智能的理解。

这种心态也塑造了他对研究节奏的看法。他并不追求短期指标，而更关注长期潜力。这种选择，在当下高度竞争、强调快速产出的AI行业中，显得尤为“反主流”，却也为后续突破埋下伏笔。

选择《Diplomacy》：为什么是最难的博弈？

Brown最为人熟知的工作之一，是在策略博弈《Diplomacy》上的研究。这一点在节目中被反复提及，因为它代表了一种不同于围棋或扑克的挑战。《Diplomacy》不仅信息不完全，而且高度依赖自然语言交流与联盟博弈。

他解释，正是这种“必须和人沟通、说服、背叛、合作”的特性，让《Diplomacy》成为研究通用智能的重要试验场。相比只需计算最优策略的棋类游戏，这类博弈更接近真实世界的社会互动。

在访谈中，他提到观看《AlphaGo》纪录片对自己的触动，但也清楚地意识到：下一个阶段不只是算力或搜索深度，而是让AI理解和参与人类的博弈方式。这种选择，本身就体现了他对AGI方向的判断。

意外发现：与AI“互动”的复杂性

在研究过程中，最让Brown感到意外的，并不是算法性能，而是人与AI互动时出现的复杂行为。他分享了一些观察：当AI能够用自然语言参与协商时，人类会下意识地赋予它意图、性格，甚至道德判断。

这种现象让他开始重新思考“智能评估”本身的问题。传统基准测试（benchmarks）往往关注单一任务表现，却忽略了互动过程中产生的涌现行为。他指出，这些涌现行为并不容易量化，却可能是通用智能的重要信号。

他并未给出简单答案，而是强调需要新的衡量方式。这也是为什么他对现有基准保持谨慎态度，并持续关注“其他 benchmarks”可能带来的启发。

通用人工智能的尺度与合作前景

谈到通用人工智能（AGI）时，Brown的态度明显偏向务实而非炒作。他认为，关键问题不是“什么时候出现AGI”，而是“我们用什么标准判断它是否存在”。如果标准不清晰，时间预测就毫无意义。

他进一步指出，真正值得投入精力的，是让AI能够与人类协作，而不是单纯取代人类决策。在节目后半段，他多次提到“cooperate with AIs”，强调未来的智能系统应当成为合作者，而非对手。

这种观点与他早期博弈研究形成呼应：无论是在游戏还是现实世界，智能的价值往往体现在协调、谈判与共同承担风险之中。

总结

通过这次长谈，Noam Brown呈现了一条清晰却不激进的AGI路径：从高风险研究中寻找突破，在复杂博弈中理解智能的社会属性，并谨慎地重新定义评估标准。对读者而言，最大的启发或许在于：通用智能并非一蹴而就的技术奇点，而是一系列关于合作、风险与长期选择的累积结果。

关键词： Noam Brown，通用人工智能，博弈AI， Diplomacy，人机协作

事实核查备注：人物：Noam Brown（Meta研究科学家）；节目：No Priors Ep.1；关键观点引用：“all research is high risk reward”“cooperate with AIs”；涉及技术与概念：Diplomacy博弈、通用人工智能（AGI）、基准测试（benchmarks）、AlphaGo纪录片。

返回文章列表