Leslie Kaelbling:从哲学到机器人,强化学习为何离不开规划与抽象
MIT教授Leslie Kaelbling在这期Lex Fridman播客中,回顾了自己从哲学走向AI与机器人的经历,系统阐述了她对强化学习、规划、抽象和POMDP的核心理解。这是一场关于“如何让机器人真正工作起来”的深度思考,也揭示了AI研究几十年反复受挫的根本原因。
MIT教授Leslie Kaelbling在这期Lex Fridman播客中,回顾了自己从哲学走向AI与机器人的经历,系统阐述了她对强化学习、规划、抽象和POMDP的核心理解。这是一场关于“如何让机器人真正工作起来”的深度思考,也揭示了AI研究几十年反复受挫的根本原因。
这是一堂由Lex Fridman在MIT讲授的深度强化学习入门课,却远不只是技术概览。它系统梳理了强化学习的核心框架,也坦率揭示了从游戏到真实世界之间的巨大鸿沟,帮助读者理解Deep RL真正困难和真正迷人的地方。
Lex Fridman在2019年初回顾深度学习的最新进展,指出自然语言处理成为关键突破口,并系统串联注意力机制、Transformer、AutoML、少样本学习到强化学习的整体脉络。这是一份理解现代AI如何走向通用能力的路线图。
这是一堂关于深度学习的入门课,却远不止介绍模型和代码。Lex Fridman从数据、算力、社区与历史周期出发,解释为什么深度学习在今天爆发,又为什么它仍然充满局限。这篇文章提炼了演讲中最具洞见的观点、案例与警示。
这期对话中,Pieter Abbeel以机器人和强化学习为核心,坦诚讨论了当下AI最被高估与最被低估的地方。从“机器人何时能打败费德勒”的玩笑问题出发,他逐步揭示了硬件、层级推理与泛化能力才是通向通用智能的真正瓶颈。
如果你以为“学会世界模型,强化学习就起飞了”,这场 OpenAI 内部分享会当头泼了一盆冷水。Alex Botev 用真实的机器人实验告诉你:模型不是越强越好,关键在于怎么用。更重要的是,他给出了一条现实可行的折中路线。
2018年,OpenAI一次实习生分享里,悄悄点破了生成式模型最残酷也最重要的真相:会“想象”的模型,反而最容易被骗。这场关于世界模型、VAE、PixelCNN和可逆流的演讲,至今仍在影响AI Agent的设计路径。
当机器人能灵巧地转动物体,却因为摄像头轻微挪动就“失明”,问题不在控制,而在视觉。OpenAI 2018 年的一次实习分享,揭开了一个反直觉事实:再强的神经网络,也会被错误的视觉假设拖垮。
五个AI,没有语音、没有情绪,却在Dota里把人类打到GG。更反直觉的是,它们赢的不是操作,而是团队判断。OpenAI Five这次展示的,不是一场游戏胜利,而是一种可复制的群体智能训练范式。
在这场MIT AGI系列演讲中,OpenAI联合创始人Ilya Sutskever系统阐述了他对通用人工智能的核心判断:为什么神经网络是基础,强化学习和元学习将改变能力边界,以及自博弈和AI安全在终局阶段的重要性。这是一份来自一线研究者的思考框架,而非事后总结。