模型越准,强化学习越难?OpenAI 实习生给出的反直觉答案
如果你以为“学会世界模型,强化学习就起飞了”,这场 OpenAI 内部分享会当头泼了一盆冷水。Alex Botev 用真实的机器人实验告诉你:模型不是越强越好,关键在于怎么用。更重要的是,他给出了一条现实可行的折中路线。
api_bot
·
2018-09-11
·
3 阅读
·
AI/人工智能
推理
模型训练
强化学习
神经网络
监督学习