文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型通用人工智能

模型越准，强化学习越难？OpenAI 实习生给出的反直觉答案

如果你以为“学会世界模型，强化学习就起飞了”，这场 OpenAI 内部分享会当头泼了一盆冷水。Alex Botev 用真实的机器人实验告诉你：模型不是越强越好，关键在于怎么用。更重要的是，他给出了一条现实可行的折中路线。

api_bot · 2018-09-11 · 14 阅读 · AI/人工智能

推理模型训练强化学习神经网络监督学习

一个实习生的演讲，提前预告了世界模型的真实天花板

2018年，OpenAI一次实习生分享里，悄悄点破了生成式模型最残酷也最重要的真相：会“想象”的模型，反而最容易被骗。这场关于世界模型、VAE、PixelCNN和可逆流的演讲，至今仍在影响AI Agent的设计路径。

api_bot · 2018-09-11 · 27 阅读 · AI/人工智能

模型训练强化学习 AI Agent 神经网络生成式AI

机器人最怕的不是手笨，而是“看不准”：一次视觉估计的反击战

当机器人能灵巧地转动物体，却因为摄像头轻微挪动就“失明”，问题不在控制，而在视觉。OpenAI 2018 年的一次实习分享，揭开了一个反直觉事实：再强的神经网络，也会被错误的视觉假设拖垮。

api_bot · 2018-09-11 · 13 阅读 · AI/人工智能

模型训练机器学习强化学习通用人工智能神经网络

OpenAI Five不是在打Dota，而是在重写团队智能的边界

五个AI，没有语音、没有情绪，却在Dota里把人类打到GG。更反直觉的是，它们赢的不是操作，而是团队判断。OpenAI Five这次展示的，不是一场游戏胜利，而是一种可复制的群体智能训练范式。

api_bot · 2018-06-25 · 9 阅读 · AI/人工智能

模型训练强化学习

Ilya Sutskever在MIT谈AGI：从强化学习到自博弈的关键路径

在这场MIT AGI系列演讲中，OpenAI联合创始人Ilya Sutskever系统阐述了他对通用人工智能的核心判断：为什么神经网络是基础，强化学习和元学习将改变能力边界，以及自博弈和AI安全在终局阶段的重要性。这是一份来自一线研究者的思考框架，而非事后总结。

api_bot · 2018-04-25 · 17 阅读 · AI/人工智能

强化学习通用人工智能神经网络 AI安全 Ilya Sutskever

从马尔可夫决策到DQN：MIT课堂里的深度强化学习全景

这是一堂来自MIT的深度强化学习入门课。Lex Fridman以教学者而非布道者的姿态，从经典的马尔可夫决策过程讲起，一步步推导到深度Q网络，并结合Atari游戏和自动驾驶交通系统，解释为什么“几个看似微小的工程改动，改变了一整个领域”。

api_bot · 2018-01-25 · 15 阅读 · AI/人工智能

强化学习神经网络

MIT自动驾驶课的冷静视角：在炒作与现实之间设计AI系统

这是一场来自MIT课堂的自动驾驶深度分享。Lex Fridman并没有重复行业口号，而是从真实道路、系统设计和人类因素出发，拆解自动驾驶的技术路径、局限与未来方向，帮助读者理解为什么“真正可用的自动驾驶”远比想象中复杂。

api_bot · 2018-01-20 · 15 阅读 · AI/人工智能

强化学习深度学习

从IPFS到Filecoin：去中心化网络为何终于等到成熟时刻

这期 YC 播客中，Juan Benet 与 Dalton Caldwell 回顾了 IPFS 与 Filecoin 的诞生背景，解释了为何点对点网络曾长期失败，又为何在今天重新变得可行。视频不仅讲清了技术路径，更揭示了激励、长期研究与基础设施建设之间的深层逻辑。

api_bot · 2017-07-01 · 19 阅读 · AI/人工智能

强化学习 Y Combinator

穿越时间的神经网络：RNN为何如此迷人又如此棘手

这是一堂来自MIT的经典课程，Lex Fridman用直觉、例子和少量公式，讲清了循环神经网络（RNN）如何处理时间序列，以及它为什么既强大又脆弱。你将理解RNN、梯度消失、LSTM背后的真正逻辑，以及它们为何成为语音、翻译和自动驾驶的核心技术。

api_bot · 2017-02-01 · 13 阅读 · AI/人工智能

强化学习神经网络深度学习语音识别

从感知机到自动驾驶：MIT用一堂课讲清深度强化学习

这篇文章还原了MIT 6.S094课堂中关于深度强化学习的完整思路：从监督学习的局限出发，逐步引出强化学习的核心概念，并通过DeepTraffic项目与DeepMind的DQN案例，解释为何“从像素到动作”的学习范式会改变自动驾驶与决策系统的未来。

api_bot · 2017-01-22 · 15 阅读 · AI/人工智能

推理模型训练机器学习强化学习神经网络

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

3 月，1 周前