从强化学习到“以人为中心”的AI：Eric Zelikman的研究与创业转向

AI PM 编辑部 · 2025年10月09日 · 11 阅读 · AI/人工智能

正在加载视频...

视频章节

在这期 No Priors 对话中，Eric Zelikman 回顾了自己从斯坦福研究者到创办 Humans& 的路径。他并未停留在算法性能本身，而是反复强调：真正有价值的 AI，必须理解并放大人的能力与动机。

从强化学习到“以人为中心”的AI：Eric Zelikman的研究与创业转向

在这期 No Priors 对话中，Eric Zelikman 回顾了自己从斯坦福研究者到创办 Humans& 的路径。他并未停留在算法性能本身，而是反复强调：真正有价值的 AI，必须理解并放大人的能力与动机。

为什么“人”始终是他研究的起点

理解一位研究者的技术选择，往往要回到最早的动机。在节目一开始，Eric Zelikman 就把话题拉回到个人经历。他提到，自己很早就被一个问题困扰：世界上有大量各具天赋的人，但这些能力往往没有被充分释放。正是这种关注“人如何发挥潜能”的视角，引导他进入机器学习领域。

他在访谈中用一句非常直白的话概括了这种动机：“I’ve been motivated by this question of… all of these people out there who have all of these things that they’re really talented in。”这并不是典型工程师从算力或 benchmark 出发的叙述，而是一种以人为中心的技术直觉。机器学习在他眼中，不只是自动化工具，而是一种可能帮助人类更好表达和实现能力的放大器。

这一点也解释了为什么他在学生阶段就对更“难”的问题产生兴趣：不是因为难度本身，而是因为这些问题更贴近真实世界中人的复杂目标。

在强化学习中寻找“可扩展的推理”

强化学习（Reinforcement Learning）常被视为一种偏工程或偏实验的技术路线，但 Eric 在节目中反复强调“推理”和“扩展性”。他讨论的不是单一算法技巧，而是：当任务复杂度上升、目标不再清晰时，模型是否还能稳定学习并做出合理决策。

他提到自己在学术研究阶段所关注的核心问题之一，是如何让强化学习方法在更大规模、更真实的问题上工作。这背后隐含的挑战是：现实世界的奖励信号稀疏、不完美，而且往往与人类真实意图存在偏差。

在这一段对话中，主持人多次追问他是否从一开始就带着“human‑centric”的视角做选择。Eric 的回答并不绝对，但他明确表示，正是因为关心人类目标的复杂性，他才会不断尝试解决那些看起来“不那么干净”的问题。

从研究到工业：为什么选择离开学术舒适区

随着研究成果逐渐被社区采用，一些方法也成为更广泛使用的组成部分，Eric 面临一个典型但并不容易的抉择：是继续深耕学术，还是走向工业环境。节目中提到，他后来进入了 Grok（访谈中提及的公司名称），开始在更贴近实际应用的场景中工作。

这个阶段的转变，并非单纯为了“影响力更大”。他谈到，在真实系统中，模型的失败方式会直接影响用户，而不是只体现在论文的附录里。这种反馈迫使研究者重新思考什么才算“好”的模型。

他用一句非常朴素的话总结这一阶段的目标：帮助系统“accomplish the things that they care about”。这里的“they”，指的正是使用系统的人，而不是指标或榜单。

创办 Humans&：把AI重新对准人的目标

访谈后半段，话题转向他的新公司 Humans&。与传统 AI 初创公司强调效率或自动化不同，Eric 描绘的是一个更长期的愿景：AI 应该在关键维度上理解人类，而不仅仅是替代人类。

他指出，即使模型在很多任务上已经表现出色，仍然存在“meaningful dimensions”——也就是那些与价值判断、长期目标和个人偏好相关的维度——尚未被很好建模。这正是他认为未来最重要、也最容易被低估的挑战。

在谈到使命时，他用一个极其简短但有力量的词来概括方向：“empower us”。不是控制，不是取代，而是赋能。这也成为他从研究者转向创业者的核心理由。

总结

这期对话并没有给出炫目的技术细节，而是展示了一条清晰的思想主线：从关注人的潜能出发，选择研究问题；在强化学习中探索可扩展的推理；再把这些经验带入真实世界，最终走向创业。对读者而言，最大的启发或许在于：真正长期有价值的 AI 工作，往往不是从模型开始，而是从“人真正关心什么”开始。

关键词： Eric Zelikman， No Priors，强化学习，以人为中心的AI， Humans&

事实核查备注： 1. 节目名称：No Priors Ep. 135
2. 嘉宾：Eric Zelikman（曾在 Stanford，从事强化学习研究，后创办 Humans&）
3. 话题关键词：机器学习、强化学习、人本视角
4. 引用原话片段来源于公开视频中可识别语句，如“I’ve been motivated by this question…”、“accomplish the things that they care about”、“empower us”

返回文章列表