OpenAI首席科学家泼冷水:持续学习没被低估,真正难的是价值泛化
当整个行业都在高喊“Continual Learning 是下一座金矿”时,OpenAI 的首席科学家却在播客里给这个共识降了温:这不是被忽视的问题,而是已经在路上的目标。真正让他夜不能寐的,是模型在未知情境下会“退回到什么价值”。这期对话,把 AI 对齐的焦点从口号拉回了硬骨头。
当整个行业都在高喊“Continual Learning 是下一座金矿”时,OpenAI 的首席科学家却在播客里给这个共识降了温:这不是被忽视的问题,而是已经在路上的目标。真正让他夜不能寐的,是模型在未知情境下会“退回到什么价值”。这期对话,把 AI 对齐的焦点从口号拉回了硬骨头。
很多团队都在用大模型给大模型打分,但结果往往不稳定、不可复现,甚至越优化越偏。Mahmoud Mabrouk 在这场实战型分享里直接开炮:问题不在模型,而在“裁判”。更关键的是,他给出了一套真的跑得通的解法。
OpenAI刚发布了一份13页的政策文件,却遭到科技圈冷遇,连AI评论者都直言“非常不喜欢”。它到底踩中了什么雷?又有哪些被忽视的关键信号,可能影响下一代模型与产业格局?
当大多数人还在讨论 AI Agent 能不能写代码、做客服时,Circle 联合创始人兼 CEO Jeremy Allaire 抛出了一个更“危险”的判断:AI Agent 最先彻底改变的,是金融系统本身。这期 No Priors 的对话,把稳定币、美元、区块链和 AI Agent 串成了一条清晰但反直觉的路线图。
所有人都以为 Meta 的 AI 故事快讲不下去了,但就在市场准备给它贴上“陪跑者”标签时,Meta 甩出了一套新模型,情绪瞬间反转。更刺激的是:这可能也是 Meta 最后一次如此坚定地拥抱开源。
Anthropic 发布了迄今最强模型 Mythos,但真正引爆讨论的不是性能,而是它“不对公众开放”。系统卡里的安全表述、能力展示的边界、以及行业内截然不同的反应,让 Mythos 成为一次关于 AI 权力、风险与节制的现实压力测试。
如果未来的网页和App不再只是“被点击”,而是能感知你的情绪并实时回应,会发生什么?Sebastian Löwe 在这场对话中抛出的不是科幻,而是一个已经开始运转的现实:情绪,正在成为下一代人机界面的输入信号。
这期超过两小时的 TBPN,不是单点爆料,而是一次密集的行业体检:Meta 刚放出新模型,市场却在私下讨论更大的 IPO 叙事;一边是 Mythos、RoboLamp 这些听起来像概念片的产品,一边是 npm 生态被黑带来的真实恐慌。这是一集把 AI、创业与基础设施焦虑揉在一起的节目。
你以为 AI Agent 的核心是更聪明的模型,但 Greg Isenberg 在这期播客里反复强调:真正拉开差距的,是上下文、流程和“技能文件”。更反直觉的是,模型并不会思考——但你依然可以把它训练得像一个老员工。
EveryY把一件看似疯狂的事变成了日常:给每位员工配一个AI Agent,而且不是“助手”,而是能独立干活、彼此协作的数字分身。结果不仅效率暴涨,组织结构、信任机制,甚至伦理边界都被重新定义。