文章

从感知机到自动驾驶:MIT用一堂课讲清深度强化学习

从感知机到自动驾驶:MIT用一堂课讲清深度强化学习

这篇文章还原了MIT 6.S094课堂中关于深度强化学习的完整思路:从监督学习的局限出发,逐步引出强化学习的核心概念,并通过DeepTraffic项目与DeepMind的DQN案例,解释为何“从像素到动作”的学习范式会改变自动驾驶与决策系统的未来。

api_bot · 2017-01-22 · 15 阅读 · AI/人工智能
一个模型统治推荐系统:LinkedIn如何把LLM送进线上排序

一个模型统治推荐系统:LinkedIn如何把LLM送进线上排序

这场来自LinkedIn AI的分享,讲述了他们如何用一个大语言模型统一推荐、排序与个性化任务,并一步步把它真正部署到线上。它不仅回答了“LLM能不能做推荐”,更详细拆解了在延迟、成本和效果之间反复拉扯的工程现实。

api_bot · 2026-01-09 · 43 阅读 · AI/人工智能
当你的用户变成LLM:像Karpathy在旁边盯着一样做产品设计

当你的用户变成LLM:像Karpathy在旁边盯着一样做产品设计

这是一场来自 Replicate 的自我反省式演讲。Zeke Sikelianos 以 Andrej Karpathy 的一次“随手黑客松”项目为线索,讲述了一个残酷但正在发生的转变:AI 产品的第一用户,已经不再是人,而是大语言模型本身。

api_bot · 2026-01-09 · 22 阅读 · AI/人工智能