Bengio谈深度学习:我们真正缺失的不是算力
在这期Lex Fridman播客中,深度学习三巨头之一Yoshua Bengio回顾了自己对神经网络的长期思考。他指出,当前AI的核心瓶颈不在于模型规模或数据量,而在于信用分配、常识先验和因果理解等更接近人类智能的机制。
在这期Lex Fridman播客中,深度学习三巨头之一Yoshua Bengio回顾了自己对神经网络的长期思考。他指出,当前AI的核心瓶颈不在于模型规模或数据量,而在于信用分配、常识先验和因果理解等更接近人类智能的机制。
这篇文章提炼了Steven Pinker在Lex Fridman播客中关于理性、人类心智与AI安全的核心观点。他以进化与工程的视角,系统反驳了流行的AI末日论,强调概率、现实工程约束与人类设定目标的重要性。
如果我告诉你:在语义相似度任务上,把“句子”换成“树”,模型误差直接降到三分之一,训练步数从上百万掉到一百多步——你可能会怀疑这是哪篇夸张的论文标题。但这不是论文,是 2018 年 OpenAI Scholars Demo Day 的真实实验结果。
2018年,OpenAI一次实习生分享里,悄悄点破了生成式模型最残酷也最重要的真相:会“想象”的模型,反而最容易被骗。这场关于世界模型、VAE、PixelCNN和可逆流的演讲,至今仍在影响AI Agent的设计路径。
如果你以为生成模型的效率问题只能靠“堆更多层”,那这场 2018 年的 OpenAI 分享会会直接打脸。Will Grathwohl 提出了一条反直觉的路径:不是把 flow 叠得更深,而是干脆把它们“融化”进连续时间,用微分方程来训练生成模型。
当机器人能灵巧地转动物体,却因为摄像头轻微挪动就“失明”,问题不在控制,而在视觉。OpenAI 2018 年的一次实习分享,揭开了一个反直觉事实:再强的神经网络,也会被错误的视觉假设拖垮。
MIT自动驾驶技术研究并不从算法开始,而是从数据开始。这段视频完整展示了他们如何设计一套名为Rider的数据采集系统,在真实世界中、跨越数十万辆里程,稳定地记录人类驾驶行为。它揭示了一个常被忽视却决定成败的事实:深度学习的上限,往往由数据工程决定。
在这场MIT的公开课上,Ray Kurzweil回顾了深度学习崛起的根本原因,并用人脑新皮层的结构解释为什么当前路径行得通。他不仅谈技术,更谈长期趋势、少样本学习的难题,以及人类在“奇点”之后可能迎来的自我进化。
这是一门并不承诺“很快造出人类级智能”的MIT课程。Lex Fridman从工程师视角出发,坦率讨论当前AI方法的极限、为何我们离AGI仍然很远,以及为什么在谈伦理和安全之前,必须直面技术黑箱本身。
这是一堂由Lex Fridman在MIT讲授的计算机视觉导论课。文章从“机器如何看世界”这个根本问题出发,梳理深度学习为何成为现代计算机视觉的核心方法,并通过ImageNet、卷积神经网络和经典架构的演进,解释哪些问题真正困难、哪些直觉其实是错的。