从强化学习到“以人为中心”的AI:Eric Zelikman的研究与创业转向

AI PM 编辑部 · 2025年10月09日 · 11 阅读 · AI/人工智能

正在加载视频...

视频章节

在这期 No Priors 对话中,Eric Zelikman 回顾了自己从斯坦福研究者到创办 Humans& 的路径。他并未停留在算法性能本身,而是反复强调:真正有价值的 AI,必须理解并放大人的能力与动机。

从强化学习到“以人为中心”的AI:Eric Zelikman的研究与创业转向

在这期 No Priors 对话中,Eric Zelikman 回顾了自己从斯坦福研究者到创办 Humans& 的路径。他并未停留在算法性能本身,而是反复强调:真正有价值的 AI,必须理解并放大人的能力与动机。

为什么“人”始终是他研究的起点

理解一位研究者的技术选择,往往要回到最早的动机。在节目一开始,Eric Zelikman 就把话题拉回到个人经历。他提到,自己很早就被一个问题困扰:世界上有大量各具天赋的人,但这些能力往往没有被充分释放。正是这种关注“人如何发挥潜能”的视角,引导他进入机器学习领域。

他在访谈中用一句非常直白的话概括了这种动机:“I’ve been motivated by this question of… all of these people out there who have all of these things that they’re really talented in。”这并不是典型工程师从算力或 benchmark 出发的叙述,而是一种以人为中心的技术直觉。机器学习在他眼中,不只是自动化工具,而是一种可能帮助人类更好表达和实现能力的放大器。

这一点也解释了为什么他在学生阶段就对更“难”的问题产生兴趣:不是因为难度本身,而是因为这些问题更贴近真实世界中人的复杂目标。

在强化学习中寻找“可扩展的推理”

强化学习(Reinforcement Learning)常被视为一种偏工程或偏实验的技术路线,但 Eric 在节目中反复强调“推理”和“扩展性”。他讨论的不是单一算法技巧,而是:当任务复杂度上升、目标不再清晰时,模型是否还能稳定学习并做出合理决策。

他提到自己在学术研究阶段所关注的核心问题之一,是如何让强化学习方法在更大规模、更真实的问题上工作。这背后隐含的挑战是:现实世界的奖励信号稀疏、不完美,而且往往与人类真实意图存在偏差。

在这一段对话中,主持人多次追问他是否从一开始就带着“human‑centric”的视角做选择。Eric 的回答并不绝对,但他明确表示,正是因为关心人类目标的复杂性,他才会不断尝试解决那些看起来“不那么干净”的问题。

从研究到工业:为什么选择离开学术舒适区

随着研究成果逐渐被社区采用,一些方法也成为更广泛使用的组成部分,Eric 面临一个典型但并不容易的抉择:是继续深耕学术,还是走向工业环境。节目中提到,他后来进入了 Grok(访谈中提及的公司名称),开始在更贴近实际应用的场景中工作。

这个阶段的转变,并非单纯为了“影响力更大”。他谈到,在真实系统中,模型的失败方式会直接影响用户,而不是只体现在论文的附录里。这种反馈迫使研究者重新思考什么才算“好”的模型。

他用一句非常朴素的话总结这一阶段的目标:帮助系统“accomplish the things that they care about”。这里的“they”,指的正是使用系统的人,而不是指标或榜单。

创办 Humans&:把AI重新对准人的目标

访谈后半段,话题转向他的新公司 Humans&。与传统 AI 初创公司强调效率或自动化不同,Eric 描绘的是一个更长期的愿景:AI 应该在关键维度上理解人类,而不仅仅是替代人类。

他指出,即使模型在很多任务上已经表现出色,仍然存在“meaningful dimensions”——也就是那些与价值判断、长期目标和个人偏好相关的维度——尚未被很好建模。这正是他认为未来最重要、也最容易被低估的挑战。

在谈到使命时,他用一个极其简短但有力量的词来概括方向:“empower us”。不是控制,不是取代,而是赋能。这也成为他从研究者转向创业者的核心理由。

总结

这期对话并没有给出炫目的技术细节,而是展示了一条清晰的思想主线:从关注人的潜能出发,选择研究问题;在强化学习中探索可扩展的推理;再把这些经验带入真实世界,最终走向创业。对读者而言,最大的启发或许在于:真正长期有价值的 AI 工作,往往不是从模型开始,而是从“人真正关心什么”开始。


关键词: Eric Zelikman, No Priors, 强化学习, 以人为中心的AI, Humans&

事实核查备注: 1. 节目名称:No Priors Ep. 135
2. 嘉宾:Eric Zelikman(曾在 Stanford,从事强化学习研究,后创办 Humans&)
3. 话题关键词:机器学习、强化学习、人本视角
4. 引用原话片段来源于公开视频中可识别语句,如“I’ve been motivated by this question…”、“accomplish the things that they care about”、“empower us”