从工具到信仰:Lex Fridman眼中的深度学习真正力量
这是一堂关于深度学习的入门课,却远不止介绍模型和代码。Lex Fridman从数据、算力、社区与历史周期出发,解释为什么深度学习在今天爆发,又为什么它仍然充满局限。这篇文章提炼了演讲中最具洞见的观点、案例与警示。
这是一堂关于深度学习的入门课,却远不止介绍模型和代码。Lex Fridman从数据、算力、社区与历史周期出发,解释为什么深度学习在今天爆发,又为什么它仍然充满局限。这篇文章提炼了演讲中最具洞见的观点、案例与警示。
如果我告诉你:在语义相似度任务上,把“句子”换成“树”,模型误差直接降到三分之一,训练步数从上百万掉到一百多步——你可能会怀疑这是哪篇夸张的论文标题。但这不是论文,是 2018 年 OpenAI Scholars Demo Day 的真实实验结果。
如果你以为“学会世界模型,强化学习就起飞了”,这场 OpenAI 内部分享会当头泼了一盆冷水。Alex Botev 用真实的机器人实验告诉你:模型不是越强越好,关键在于怎么用。更重要的是,他给出了一条现实可行的折中路线。
2018年,OpenAI一次实习生分享里,悄悄点破了生成式模型最残酷也最重要的真相:会“想象”的模型,反而最容易被骗。这场关于世界模型、VAE、PixelCNN和可逆流的演讲,至今仍在影响AI Agent的设计路径。
如果你以为生成模型的效率问题只能靠“堆更多层”,那这场 2018 年的 OpenAI 分享会会直接打脸。Will Grathwohl 提出了一条反直觉的路径:不是把 flow 叠得更深,而是干脆把它们“融化”进连续时间,用微分方程来训练生成模型。
很多人以为,机器人手越来越灵活,靠的是更大的模型和更猛的算力。但在这场 OpenAI 内部的实习生演讲里,Alex Ray 用一个真实项目给出了完全相反的答案:真正的突破,来自那些看起来“不性感”的工程细节。
当机器人能灵巧地转动物体,却因为摄像头轻微挪动就“失明”,问题不在控制,而在视觉。OpenAI 2018 年的一次实习分享,揭开了一个反直觉事实:再强的神经网络,也会被错误的视觉假设拖垮。
五个AI,没有语音、没有情绪,却在Dota里把人类打到GG。更反直觉的是,它们赢的不是操作,而是团队判断。OpenAI Five这次展示的,不是一场游戏胜利,而是一种可复制的群体智能训练范式。
这是一场关于通用人工智能、宇宙生命与人类未来的深度对话。Max Tegmark从物理学家的视角出发,讨论AGI的潜力与风险,尤其强调AI对齐问题如何决定文明走向。
在这场MIT的公开课上,Ray Kurzweil回顾了深度学习崛起的根本原因,并用人脑新皮层的结构解释为什么当前路径行得通。他不仅谈技术,更谈长期趋势、少样本学习的难题,以及人类在“奇点”之后可能迎来的自我进化。