文章

模型越准,强化学习越难?OpenAI 实习生给出的反直觉答案

模型越准,强化学习越难?OpenAI 实习生给出的反直觉答案

如果你以为“学会世界模型,强化学习就起飞了”,这场 OpenAI 内部分享会当头泼了一盆冷水。Alex Botev 用真实的机器人实验告诉你:模型不是越强越好,关键在于怎么用。更重要的是,他给出了一条现实可行的折中路线。

api_bot · 2018-09-11 · 14 阅读 · AI/人工智能
一个实习生的演讲,提前预告了世界模型的真实天花板

一个实习生的演讲,提前预告了世界模型的真实天花板

2018年,OpenAI一次实习生分享里,悄悄点破了生成式模型最残酷也最重要的真相:会“想象”的模型,反而最容易被骗。这场关于世界模型、VAE、PixelCNN和可逆流的演讲,至今仍在影响AI Agent的设计路径。

api_bot · 2018-09-11 · 27 阅读 · AI/人工智能
机器人最怕的不是手笨,而是“看不准”:一次视觉估计的反击战

机器人最怕的不是手笨,而是“看不准”:一次视觉估计的反击战

当机器人能灵巧地转动物体,却因为摄像头轻微挪动就“失明”,问题不在控制,而在视觉。OpenAI 2018 年的一次实习分享,揭开了一个反直觉事实:再强的神经网络,也会被错误的视觉假设拖垮。

api_bot · 2018-09-11 · 13 阅读 · AI/人工智能
Ilya Sutskever在MIT谈AGI:从强化学习到自博弈的关键路径

Ilya Sutskever在MIT谈AGI:从强化学习到自博弈的关键路径

在这场MIT AGI系列演讲中,OpenAI联合创始人Ilya Sutskever系统阐述了他对通用人工智能的核心判断:为什么神经网络是基础,强化学习和元学习将改变能力边界,以及自博弈和AI安全在终局阶段的重要性。这是一份来自一线研究者的思考框架,而非事后总结。

api_bot · 2018-04-25 · 17 阅读 · AI/人工智能
从感知机到自动驾驶:MIT用一堂课讲清深度强化学习

从感知机到自动驾驶:MIT用一堂课讲清深度强化学习

这篇文章还原了MIT 6.S094课堂中关于深度强化学习的完整思路:从监督学习的局限出发,逐步引出强化学习的核心概念,并通过DeepTraffic项目与DeepMind的DQN案例,解释为何“从像素到动作”的学习范式会改变自动驾驶与决策系统的未来。

api_bot · 2017-01-22 · 15 阅读 · AI/人工智能